2008年11月5日星期三

Bioon全心奉献的系列检索讲座

Bioon全心奉献的系列检索讲座

作者:张发宝



第一讲  关键词选择

推荐先读读google从入门到精通等文章.
我们了解常规搜索方式,但每个人都会搜索出不同结果,为什么?核心问题在于关键词选择不同。
关键的分析必须保证两点:
一是专业性,即这个词是很精的,可能简化你的搜索结果,因而词甚至可以怪一点,尽量避免大众化的词,如net,site等。即使需要大众化词,如password,username,但若加入一两个特征词,则结果将大大简化。
二是具有代表性,也即这个词具有代表意义,也即它在包含你所需网页内,它在出现的可能,以免一些有用信息被遗漏。
如何达到上述两个要求?我们必须分析网页中字词出现的特点,以及本学科专业词汇特征。 大家看看yahoo,google等medicine和science--biology条目下的分类,发现许多相关的词均在内,如
http://libinfo.uark.edu/eresources/eresources.asp
医学有关的都在Science & Technology 大条目下,又细分为:
Agriculture & Food | Biology | Botany | Chemistry | Computer Science | Engineering | Environmental Dynamics | Geology | Kinesiology | Mathematics | Medicine | Nursing | Physics | Psychology | Statistics | Zoology。
因此如果仅以medicine检索,就会漏掉不少很有价值的信息,特别是漏掉的专业的。
其次,在medicine下又有很多数据库,如:EBSCO OVID,PROQUEST还有各大出版社自己的万能密码。
大家应该明白一些了吧。

第二讲  定点搜索和遍搜索的区别及应用
今天主要讲定点搜索和遍搜索的区别及应用。
所谓定点搜索,即指定找某个数据库相关信息,或某篇文章。
遍搜索是指在网上任意逛逛,找些pswd,或者无心插柳柳成荫。
(1)定点数据库和期刊搜索。还是同第一讲一样,主要分析关键词的选择。当然关键词之一是这个数据库的名称。大家注意了:数据库名称一定要用全称和简称都试试。
关键词之二是free,ID,password,user name。
为什么这个关键词?其实这些只能称作是一个关键词,因为它们具有同性或不相容性。如elservier数据库,你最好不要用username和password,因为它主要是采用IP限制的。因而你的重点放在pxory!而不是上述的任何一个。而找某一杂志,则多用user name 和ID/password合用(注:ID/password只可用一个!),因为杂志往往个人购买,便拥有帐号了。
关键词三:这些数据库可能出现的地方?大学图书馆最多!即使是杂志,图书馆也较个人帐号多。那么图书馆主页上有哪些关键词?library,database,trial,free....,可看看国内一些图书馆的主页,仔细分析比较,便能找到一些共性的东西。
(2)定点文章搜索。
文章,在国外通用PDF格式,因而文章搜索必须用PDF这个核心内容。即找后缀为PDF的东东,语法:filetype:PDF 这是关键之一
关键词之二:找你所需文章的题或文摘中最怪的词!而不是常用词。(不要用很专业的词往往能找到相近的文章,所谓无心插柳了)
命中率高,但最好是题目中出现的词,为什么?因为往往许多个人站点收录了不少文章,而这些文章往往是以题目名称作为索引的。
OK!大家感觉如何?
下次再讲!

第三讲  实战演习
这次是实战演习:
PubMed中文帮助、PubMed英文帮助
专业文献搜索技巧
注:本页是本人独创作品,若需引用,必先经过本人同意,否则一经发现,即令删除!

第四讲  专业文献搜索技巧
专业文献与普通文献不同,很难查到。这是本人长期搜索的技巧,十分有效,查专业文献实在好!

1 查找某本专业刊物的登录密码,如Brain Res
首先选关键词:杂志名(Brain Res),登录(sign in),密码(password)
这样成功率并不高,其实细细看来,不应有登录,因为许多提供密码的地方,并不出现登录这个词,而多出现用户名(user name),而且杂志名多用全称(brain research),再试试!哦,成功了!

2 查找某篇文章的全文,尤其是外文文献,许多全文服务均需收费。
当然可先按第一种方法搜索一下,看看有无密码可寻,若无,则找到该篇文章的特殊字段(key words),然后搜索PDF文件。不过这有几个条件,一是该杂志确已上网,有明确地址,其二,一般需在1997年以后文献才可。
举例:Gattullo D, Pagliaro P, Marsh NA, Losano G。New insights into nitric oxide and coronary circulation.Life Sci 1999;65(21):2167-74。
这篇文章是收费的。采用:inurldf:Gattullo Pagliaro coronary,结果24项,找到其中的第2页,有下面一项Life Sciences [Volume 65, Issue 21, Pages 2167-2268 (1999)]
... 1. New Insights into Nitric Oxide and Coronary Circulation, Pages
2167-2174 D. Gattullo, P. Pagliaro, NA Marsh and G. Losano 2. ...
147.46.94.112/journal/sej/j_l/l339.htm - 14k - 网页快照 - 类似网页
打开网页快照,第一篇即是其目录,下载即可!OK!成功

2 查找专业软件的破解软件或注册码
常规软件的注册码很好找,但专业软件太少,而且注册码也少,破解更少,如何找?
如找origin 6.1版的破解版,或注册码。不管采用网易、搜狐等软件搜索,均找不到该软件。那么只好借用特殊搜索了。
分析:一般有些破解软件的页面一般至少有以下一些信息:软件名称,版本,序列号(serial number, OR sn),破解(crack, OR CRK),提供下载的地方有.ZIP字样(压缩文件为多)。为了方便起见,也防止版本太精确反而不易搜索的特点,在googlek 输入
origin 破解, 哦!OK!成功!如果其它的软件一次搜索的结果太多的话,则考虑加6.1以减小其搜索范围。或搜索结果太少且不是需要的话,将破解换为"注册码"试试,一般效果不错。

3 查找中文文献的免费全文
如我知道重庆维普提供免费全文服务,但目前许多站点都不能用了。另外,还有万方数据库、CNKI也提供,那么我如何查到这些数据库的免费入口呢?
这需要一定的技巧,采用google或百度试试:输入:重庆维普 密码
哦!66项!仔细找一找,必有结果!OK!

第五讲  百度与google比较
大家好,这一讲讲百度与google比较
搜索英文不必说用google,搜索中文呢?
很多人并不了解它们更新的情况,google发展早,因而它贮存了大量旧的信息,百度发展迟,信息较新。
更新速度:对中文google一般半月至一月一更新,而且仅搜索到三级链接,三级以下便不在搜索,那么我如何看到最新的google搜索的结果呢?这个站点:
http://www3.google.com/,可见google采用不同服务器逐步更新的。百度的更新较快,半月一次,最快一周。那么如何衡梁这半月与一月的差剧与价值?
对于一些试用数据库,有效期短,或象万方等一月一换密码,最好选用百度,现在维普老是打一枪换一个地方,因而也只好用百度了,google往往搜索出来的结果已过期了。而能长期使用的密码或数据库,一般象国外的(国内有没有,我真不知道),最好用google,毕竟技术更老道一些,搜索出的结果更多,更广!

第六讲  关键词的选择
今天再补充讲一点关键词的选择。
关于关键词,最近看到高手huangwei98 公布的一些关键词,很值得参考。但总之一句话,高手=技巧+时间,有时多看看,往往获得其它的密码,这是太正常的事了。
关键词组合:
nurse journal password
new medicine password
What's New medicine password
périodiques électroniques password( 注意了,不是英文字母样!)
biomedical library password
LWW Journal Collection password
Bibliotekets databaser password
Kluwer Online password
journalwebsite password
基本路子仍是数据库+password+补充性关键词(或称定向性关键词)
所谓定向性关键词是将你的检索范围定于某一可能的区域,如图书馆、个人站点,以缩小检索范围。如单个杂志,可定位于个人,若是数据库检索,则宜加library,因为个人是不会买数据库的。
同时另一个定向是生物和医学,所用的关键词medicine,biology,biomed.
当然仍可加第三定向关键词,如杂志(journal)、免费(free)、在线(online),但一定要注意第三关键词的特征性不强,要选择使用,不可过用,否则会将一大批可能有用的站点排除掉,切记!
但这主要针对国外的,而国内的一般多在各大学图书馆内,常用密码、免费、杂志、数据库名等搜索,效果较好。
但对于有些杂志,如sciencedirect,Ideallibrary多采用IP验证方式,一般密码并不能用,这时多采用代理服务器方式,因而如何找到有效的代理太重要的。如清华的elsevier便是代理。下下一讲讲如何找代理

第七讲  关键词联合使用
本讲讲关键词联合使用。
国内图书馆提到数据库往往只提***数据库,而国外图书馆多列出该数据库内各种杂志名,而且多按字母分类。因而为了提高检索的准确率,一般将同一数据库内的杂志的首字母相同的杂志名用两到三个联合搜索,再结合前面讲的加用其它关键词,能有效缩小检索范围,翕中率极高。从这里可以看到,如果透彻分析一些图书馆内主页设计的特征,是搜索的关键。
如检索brain research,可列出brain research bulltin,同时检索,效果要好些。

第八讲  搜索代理服务器
本讲讲搜索代理服务器技巧
中文:
代理 维普(或其它数据库名) 数据库,能找到一些,但国内一般真正使用代理的较少。
英文:
proxy 数据库名 IE netscape
效果非常好,但一定要注意,许多地方不仅用代理服务器,而且需密码认证,不可过于乐观!应认真鉴别。

第九讲
先插几句废话,本论坛的目的是培养真正懂得搜索技巧的人员,当然搜索技巧不只是密码之类,还应包括检索常用文件,pubmed等,这也是水平和本领,切不可以找密码为乐,说真的许多网友找我要密码,其实我手头十分少,大多是本版版主和其它网友赠送的。我们应该培养全方位的文献检索能力,否则即使有密码,也未必找到自己所需的信息,网海茫茫,有用者若斯!
另外,今天开始实行高级论坛用户认证,一些网友想通过灌水进入高级论坛,我想这并没有什么必要,我并不主张一味发质量不高的帖,甚至纯粹是灌水,因为专业论坛与娱乐性论坛不同,强调质量,宁缺勿泛。这也是我一再降低进入高级论坛的门槛的原因(全论坛20篇,甚至10篇,高质量帖子甚至一两篇),因为我并不想与网友为难,只是为了安全目的。这是题外话。现在进入正题,今天讲百度和google语法,其实这在从google入门到精通中都有所阐述,这是重提,以示重视,并无太多的新意,只是将大理论与实际相结合起来。
找特定文件名的文件,尤其是PDF、ZIP、swf、DOC、TXT、RAR、EXE、RM、Mp3,MOV这些文件名都是网友想找的重点,至于各是什么类型文件,请上网查一下便知道了,这里不多说了。
方法是利用语法filetype:后缀名。
如找PDF文件,在正常关键词后面加filetype:PDF即可,搜索结果全是PDF文件。这是我写的另一篇,可参考:
http://bbs.bioon.com/bbs0/dispbbs.asp?boardID=10&RootID=839&ID=839&page=1
找特定题目的网页语法intitle:网站
查找友情链接:
"link:"(英文单字link后加冒号)用于搜索链接到某个URL地址的网页。可以了解有哪些网页把链接指向您的网页
查找特定站点:
site:www.*.com
如 金庸 古龙 site:sina.com.cn
但不可加入http://或/这类,否则是错的
cache”用来搜索GOOGLE服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。

示例:查找GOOGLE缓存的中文yahoo首页
搜索:“cache:www.yahoo.com.cn”

info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。

示例:查找和新浪首页相关的一些资讯。
搜索:“info:www.sina.com.cn”
结果:有关www.sina.com.cn的网页信息。

示例:查找美国教育网上的宇宙大爆炸jpg图片
搜索:“BIG BANG filetype:jpg site:edu”
结果:搜索有关 BIG BANG filetype:jpg site:edu 的图片

第十讲  inurl:
专讲一个特殊语法,很有用。inurl
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关inurlecurity windows2000 的网页。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。
而一般众多密码或数据库往往出现在链接之中,如查Ideallibrary
inurl;ideallibrary proxy passowrd(ID)

“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。

示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有37项查询结果,这是第1-10项 。 搜索用时0.36秒。



这语法若能活用,用途十分大!

补充讲site语法
site即将搜索定位于某一个域名上,有利于缩小搜索范围,提高搜索效率 。如keywords site:edu,效果很好!可以方便地搜索到各大学内有用的资源,至于关键词的选择,其它讲都有了。
site:tw, site:edu.tw, site: edu.cn.......
这是定位于国家或地区,将搜索局限于某些国家或地区,或加上edu,则是这些国家或地区的大学,效果自然更好。如果site:mu.edu.cn则搜索国内医科大学内的资源(会漏综合性大学的资源的,要慎用)。
一般的,欧美人的版权意识强,一般密码不易公布,相反,非洲、美洲、亚洲则往往公开密码,这是获得密码的最重要来源之一,善于利用这些地方的资源有助于提高搜索效率。

这是site两大好处,不可忽视!


第十一讲  找代理
今天讲第十二讲,顺便说一句,这里所有的内容几乎都是版主手敲进去的,绝大部分内容是原创的,少数引用其他人一些技巧,但看上去大家对它的热情并不是很高,不知是什么原因,是不是我写得太差了,或没有用?希望大家多发点意见。
今天讲代理。
国外的数据库,许多需代理,如何搜索到?普通的代理遍地都是,只要用google输入proxy free或代理服务器 免费就能搜索到非常多的代理,但这些代理并不适用于查阅一些著名数据库,好么如何找到?一般有以下几点技巧,我并作简要分析:
由于这些代理必须要出现于大学内。
(1)因而如果采用普通的免费代理,则必须保证这种代理在某个大学,这可通过代理测得,其中无特别的技巧。可见下面一个代理服务器帖子的说明
(2)如果要搜索,则应该将代理服务器限制于大学内,因而其搜索格式应该如下:
proxy 数据库名 site:edu
这是标准格式,搜索的数据库较多,但一定注意并不等于搜索出的代理都有用,有些代理还需密码支持,仔细判定。
其它类似可选关键词也列一些,与上述核心关键词适当组合便可,提高搜索准确率:
Off-Campus:能提高无密码搜索成功率
netscape:能提高准确率
大家试试,再花些工夫,我想一定收获大大的。 sciencedirect甚至都可找出

上面讲代理,有时甚至要先找代理,后找密码,二者可结合起来,当然麻烦是肯定的。
另外,代理未必一定找美国的(site:edu),也可考虑找台湾等其它地方,其格式可换为site:edu.tw,site;edu.fr, site:edu.kr等等,收获往往更大。这也是一些小的 经验,大家在平时注意积累,会有很多发现的。

没有评论: