首页 理论教育 利用网络渠道获取信息

利用网络渠道获取信息

时间:2026-01-22 理论教育 小可爱 版权反馈
【摘要】:(一)网络信息采集的方法1.通过搜索引擎采集搜索引擎是一个系统,能从大量信息中找到所需的信息,提供给用户。

(一)网络信息采集的方法

1.通过搜索引擎采集

搜索引擎是一个系统,能从大量信息中找到所需的信息,提供给用户。搜索引擎的出现逐渐改变了人们的生活习惯和思维方式。

2.通过网站采集

根据需要的信息类别直接到相关网站进行采集。如新闻信息网站可以访问人民网、新华网、中国日报网等;财经信息网站可以访问商务部网站、财政部网站、人民银行网站等;教育信息网站可以访问各个大学网站、中国教育和科研计算机网、教育部网站等;科技信息网站可以访问国家科技部网站、各门户网站科技频道、中国公众科技网等;网络文学网站可以访问榕树下、红袖添香、潇湘书院等。

3.通过论坛采集

网站编辑可以到各种论坛中找内容、发现信息源。论坛中的信息质量参差不齐,很多原创内容被埋没在了大量的无关内容中。综合论坛有天涯社区、猫扑、新浪论坛、搜狐论坛等。

4.通过邮件列表采集

邮件列表是指建立在互联网上的电子邮件地址的集合。利用这一邮件地址的集合,邮件列表的使用者可以方便地利用邮件列表软件将有关信息发送到所有订户的邮箱中。国内提供邮件列表服务的网站有希网、索易等,此外,百度、谷歌等网站也提供分类或关键词邮件新闻订阅等服务。

5.通过网络数据库采集

网络数据库具有信息量大、更新快,品种齐全、内容丰富,数据标引深度高、检索功能完善等特点,也是获取信息尤其是文献信息的一个有效途径。网络数据库有收费数据库和免费数据库之分。收费数据库一般需要购买使用权;免费数据库主要是专利、标准、政府出版物,一般是政府、学会、非营利性组织创建并维护的数据库。

(二)通过搜索引擎获取信息

1.关键词搜索

关键词是指表示文献实质意义的名词或词组,常出现在文献篇名或文献正文中。它是科技论文的文献检索标识,是表达文献主题概念的自然语言词汇。关键词选得是否恰当,关系到该文被检索和该成果的利用率。

为了更好地利用关键词搜索我们所需要的信息,我们可以灵活利用运算符号把几个关键词连接起来,以便搜索同时满足这几个条件的信息,具体操作见表2-1。

表2-1 关联词连接搜索操作

2.使用常用搜索引擎——百度

(1)百度搜索引擎概述。百度搜索引擎于1999年年底由李彦宏和徐勇创建。百度是目前国内最大的商业化全文搜索引擎。百度搜索引擎由四部分组成:蜘蛛程序、监控程序、索引数据库、检索程序,如图2-1所示。

百度搜索引擎使用了高性能的“网络蜘蛛”程序而自动在互联网中搜索信息,可定制高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。百度搜索引擎拥有庞大的中文信息库,总量达到6000万页甚至以上,并且还在以每天几十万页的速度快速增长。

图2-1

百度还有股票、列车时刻表;飞机航班查询;精确匹配(双引号和书名号);高级搜索和个性设置等。常用搜索引擎还有谷歌、搜狐、必应、有道等。

(2)百度搜索具体操作步骤。在说使用方法之前我们先了解一下如何让结果更匹配我们的需求?

方法/步骤:

例如,我们搜索“书籍网站推荐”,可能是想找一篇文章,里面系统介绍若干优质的可以查看书籍的网站。但实际操作,往往搜索出来一大堆乱七八糟的网站。

那么,怎么能让搜索结果和自己的期望值更加符合呢?说几个大家经常遇到的问题:

①关键词的秘密。在百度搜索“电影网站推荐”,以及搜索“电影网站推荐”,有什么异同?

②如何选择关键词?

例如,我们想要减肥,很关心减肥的时候适合吃什么食物,这时候应该用什么关键词去搜索?

③如何缩小查找范围?

例如,我们都知道,豆瓣是电影评分、评价、推荐类最为权威和全面的一个网站。有一天,我想看悬疑电影,想要搜索几部别人推荐的电影。我希望在百度搜索的时候,只返回豆瓣网的查找结果,应该怎么做?

④如何“不查找某些内容”?

例如,我们希望查找的结果里面不要包含“密码”这个关键词,具体应该怎么做?

所以,再简单的事其实都可以不断深入思考,做到比原来更好。牛人之所以为牛人,不是吃了什么灵丹妙药就一步登天了,而是在这些细微的地方从来不忘记琢磨。

上面提到的问题,我们都可以通过学习几个简单的搜索技巧来搞定。

在这之前,我们来学习搜索引擎非常核心的一个概念,叫“分词”。

什么叫分词呢?百度搜索引擎的处理流程是怎样的呢?

方法/步骤:

例如,我们用“推理小说推荐”这个关键词在百度进行搜索,百度大概的处理流程是下面这样子的,如图2-2所示。

图2-2

查找是否有网页包含“推理小说推荐”这个完整的关键词,有就优先返回到查找结果。

百度会拆分这个长关键词,如会拆分成“推理”“小说”“推荐”,以及他们的组合词,比如“小说推荐”。

百度会分别用拆分出的这些关键词去查找是否有匹配网页,有就进行返回操作。

这个过程的第二步就可以理解为“分词”。当然,搜索引擎真正的工作过程肯定比这个要复杂得多,但对我们来说理解到这个程度就差不多了。

了解了基本概念和搜索引擎的基本工作过程,我们再来掌握搜索引擎最核心的一个使用性的功能——搜索指令。这个也是我们的重点——百度搜索使用方法。

什么叫搜索指令呢?如何使用搜索指令呢?

方法/步骤1:(https://www.xing528.com)

假设我们在百度搜索“推理小说推荐”(注意,一定要包含双引号),搜索结果如图2-3所示。

方法/步骤2:

你会看到,所有搜索结果都完整包含了“推理小说推荐”这个关键词。

图2-3

在这里,双引号其实就是一个搜索指令(注意,是英文状态的双引号)。

它的作用是:告诉搜索引擎,将双引号里面的关键词作为一个整体进行搜索,不要进行分词操作。

所以你会看到,有了搜索指令,我们可以告诉搜索引擎更加精细化的搜索要求,从而更快速得到精准的查找结果。

方法/步骤3:

类似的搜索指令还有不少,如下面这些:

intitle:关键词,告诉搜索引擎,标题中一定要包含搜索关键词(网页内容有不算数)。

同时,不同的搜索指令有时候还可以搭配使用。比如intitle和“”搭配使用的效果如下图2-4所示。

图2-4

下面的一些搜索指令也很好用,篇幅限制,这里仅简单介绍下。

方法/步骤:

关键词filetype:文件类型只搜索特定格式的文件。

site:网址这个指令的作用是只在特定的网页进行查找并返回结果。

关键词A-关键词B:搜索包含关键词A,但不包含关键词B的网页。

注意事项:

关键词加引号的词如“推理小说推荐”,注意,是英文状态的双引号。

(三)通过专业行业网站获取信息

随着计算机技术、网络技术的迅猛发展,以网站为依托的信息传播、管理、储存、检索对社会各行业的渗透广度和深度发生了巨大变化。网站专业化发展的趋势表现尤为突出。由于不同网站对不同行业的影响或是其关联度不同,相继出现了门户网站、专业网站、专业垂直网站等。其中,垂直行业门户网站对该行业信息的广度、深度、精细度、准确度更高,时效更好。我们以垂直行业门户网站为例,讲解通过行业专业网站获取信息的方法。

1.垂直行业门户网站及分类

(1)垂直行业门户网站。垂直行业门户网站是指面向特定行业领域,为企业以及商务人士提供信息交流、资源互享,提供实物和服务交易的第三方电子商务平台。

垂直行业门户网站是相对传统门户网站内容广泛而全面,覆盖各行各业而言的。垂直行业门户专注于某一领域(或地域),如IT、娱乐、体育,力求成为关心某一领域(或地域)内容的人上网的第一站。

垂直行业门户网站的特色就是专一。他们并不追求大而全,只做自己熟悉领域的事。他们是各自行业的权威、专家,其吸引顾客的手段就是将网站做得更专业、更权威、更精彩。而垂直网站的顾客也不是普通的顾客。他们基本上都是该行业的消费者。每一个顾客代表的购买力比综合网站顾客的平均水平要高出许多倍。因此,垂直行业门户网站便为顾客提供了一条龙式的服务模式——以自己的内容指引顾客消费自己的商品。垂直行业门户网站的电子商务有专家指引,购物方便又明智,吸引了越来越多的顾客。

(2)垂直行业门户网站的分类。企业性质垂直行业门户网站:利用企业在该行业的领先地位而建立,以行业信息资源整合、扩大企业形象宣传为目的,如图2-5所示。

图2-5

运营性质行业门户网站:利用自身技术优势、运营优势等资源优势而建立的,以信息资源整合、为行业供需双方提供服务从而达到盈利目的网站。如图2-6所示,深圳海天电子商务有限公司是一家电子商务服务公司,该公司自主研发的IT软件(深圳海天电子商务有限公司面向行业协同电子商务系统软件)是为垂直行业类门户网站量身定做的大型软件系统。

行政性质行业门户网站:利用行业号召力和社会公信力,以行业资源整合推广、服务行业企业和用户、提高辖区行业知名度、进行招商引资等为目的。

图2-6

2.通过垂直行业门户网站获得信息

案例2-1

慧聪网的优势互补策略

慧聪网成立于1992年,是国内领先的B2B电子商务服务提供商,其依托核心互联网产品买卖通以及雄厚的传统营销渠道——慧聪商情广告与中国资讯大全、研究院行业分析报告为客户提供线上、线下的全方位服务,这种优势互补,纵横立体的架构,已成为中国B2B行业的典范,对电子商务的发展具有革命性影响。

通过慧聪网获取商品、交易等方面的专业信息,在检索信息的同时也可以发布信息,用户可以根据自己的需要和屏幕上的提示进行。

案例2-2

通过百企网(图2-7)可获得以下信息:

(1)展会信息。为广大中小企业提供最新展会信息、组织企业参加展会,提高企业知名度。

(2)网上订单。为广大中小企业提供网上交易平台,促进企业电子商务发展。

(3)网上融资。为广大中小企业收集网上订单数据,为中小企业选择合适的金融产品。

(4)设备采购。为广大中小企业提供进口大型印刷/纺织等设备融资咨询服务。

(5)网上物流。为广大中小企业收集网上物流数据,提供给银行作为企业信贷评分项之一。

(6)水电数据。为广大中小企业收集水、电单数据,提供给银行作为企业信贷评分项之一。

图2-7

除此以外,还有很多垂直行业门户网站,可以根据自己的需要选择。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈