首页 理论教育 如何寻找数据源-大学生职场核心能力训练教程

如何寻找数据源-大学生职场核心能力训练教程

时间:2023-08-19 理论教育 版权反馈
【摘要】:创业早期的项目,80%以上的关键数据都是不公开的。·内部二手数据:公司的员工,包括前员工,都掌握大量的数据;公司官网公布的财报、公关稿、招聘信息等。数据总是跟一定的事件或事实联系在一起。所以,寻找数据源的重要一环往往是通过搜索引擎查找相关事件。

如何寻找数据源-大学生职场核心能力训练教程

已经明确了数据采集的目标,也清楚了想看哪些产品的哪些维度,接下来就是如何开始采集数据。

创业早期的项目,80%以上的关键数据都是不公开的。所以,如果一个产品没有融资,或者融资了也没有在各类媒体发布公关稿,那在网上是没有办法找到相关信息的。

那么,到底在哪里去采集这些关键数据呢?主要有三个地方。

·一手数据:用户、产品和供应商是任何业务核心聚焦的三点,这三个点的数据是最真实的数据。

·内部二手数据:公司的员工,包括前员工,都掌握大量的数据;公司官网公布的财报、公关稿、招聘信息等。

·外部二手数据:行业专家、行业资深创业者、公开的项目库、公开文章、报道、演讲等。

数据总是跟一定的事件或事实联系在一起。所以,寻找数据源的重要一环往往是通过搜索引擎查找相关事件。查找的时候要注意一些有效的技巧。

常用操作算符

·引号:把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。

·减号:减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词,如:“搜索 -引擎”返回的则是包含“搜索”这个词,却不包含“引擎”这个词的结果。

·星号:星号*是常用的通配符,也可以用在搜索中。百度不支持*号搜索指令。在谷歌中搜索:“搜索*擎”;其中的*号代表任何文字。返回的结果就不仅包含“搜索引擎”,还包含了“搜索收擎”“搜索巨擎”等内容。

·使用空格:使用单个词搜索,往往会反馈回大量的不需要的信息。如果想精确地查找某些结果,需要使用多个关键词来加强搜索的条件。使用多个词搜索的时候,不同词语之间需要用一个空格隔开。例如:想查询马云上福布斯封面的消息,如果只搜索“马云”,会得到很多关于马云的搜索结果,很难找到想要的信息。但是搜索“马云 福布斯封面”,搜索结果中的第一条就是我们想要的。

常用技巧

·技巧1:合理利用“与/或”的搜索

大多数的用户都没有意识到,百度会自动假定一次搜索要求中所有的词之间都是一种“和”的关系。也就是,如果你输入两个词,它就会假定你所寻找的页面是包含这两个词的。它不会反馈给你仅包含其中一个词的页面。

因此,如果你想要一个“与/或”的搜索——搜索包括一个或另一个词的页面,但不一定是都包括二者,你必须在两个关键词之间插入一个带有“或者”功能的操作。当你在搜索引擎中输入这个表示“或者”操作的“OR”时,请确保所输入的要大写,否则搜索引擎会将它视为一个忽略的单词(stop word)。(www.xing528.com)

·技巧2:你的搜索中包括或不包括的词

百度会自动地将在你输入的搜索要求中的不重要的、普通的词忽略掉。这些被称作是“忽略的单词”,包括“and”“the”“where”“how”“what”“or”(所有字母皆为小写),还有其他一些类似的词——包括一些单独的数字或单独的字母(例如“a”)。

在搜索中包含忽略的单词并没有什么大碍,不过会使搜索速度有些下降,这就是百度将它们剔除的原因。举一个例子,你想要搜索的是“how a toaster works”(烤箱如何工作),百度会移除“how”和“a”两个词,并自行按新的更短的关键词“toaster works”进行搜索。

如果你想要让这些一般的词包含在你的搜索要求内,你可以让百度必须在搜索中包含这些特定的词,使它不去排除“忽略的单词”。想要做到这点,你可以在你确实需要的词之前加上一个“+”符号。例如,要在搜索要求中包含“how”,你应该输入“+how”。请确保在+符号之前有一个空格符,而不是在它之后。而如果想要通过排除一些包含特定词的页面来精炼你的搜索结果,你可以通过使用一个“-”号来去掉搜索结果中不想要包括在内的词,同样,也请记住在“-”符号之前留一个空格符。

例如,如果你想要搜索“bass”,你所得到的页面可能会包括名字中带有bass的男歌手或是关于一种叫Bass的鱼。如果你只想搜索歌手的页面,输入搜索要求时应如下:“bass -fish”。

·技巧3:搜索近似的词

百度能够通过使用“~”符号让你搜索近似的词。只需在想要搜索的词之前加上“~”符号,百度就会搜索所有包括这个词以及合适的近义词的页面。

例如,要搜索类似“elderly”的词,输入“~elderly”,所得到的页面就会不仅是包括“elderly”这个词,还会有包括“senior”“older”“aged”等等词的页面。

还有个小技巧:如果只需要列出近义词的页面,而不需要给出许多原先输入的那个词的页面,可以用“-”符号来连接“~”操作,例如“~keyword -keyword”。这样就能在近义词所得的结果中排除原先输入的词。在先前的例子中,要得到仅有“elderly”近义词的搜索结果,就输入“~elderly -elderly”即可。

·技巧4:搜索特定的词组

当你搜索一个特定词组时,如果你只是简单地输入词组中所有的词你是无法得到最好的结果的。你应该将整个词组放在一个引号内。这样就能让搜索引擎搜索规定顺序的精确的关键词。

例如,如果你要搜索“Monty Python”,你可以输入monty python作为你的搜索要求,结果中会包含所有有着“monty”和“python”两个词的页面。但这些结果并不仅是包含了关于这个英国喜剧团体的页面,还包括了名叫Monty的所有人、动植物、事件。为了将搜索结果限定在与Monty Python喜剧团有关的内容,也就是你想要搜索的页面是按规定的顺序将这两个词作为一个词组包含在内的,你就应该在输入搜索要求时输入“monty python”——确保这个词组在引号之内。这样的话,如果没有按照规定的顺序将这两个词匹配为一个精确的词组,这个页面就不会被列在搜索结果当中。

·技巧5:列出相似的页面

如果一个网页是你确实很喜欢,但你又想知道是否还有与它类似的其他网页,你可以使用搜索引擎的相关来寻找:这个操作算符所显示的页面与特定的页面在某些方面是相似的。例如,如果你很喜欢InformIT上的文章,你可以通过输入“related:http://www.informit.com”来寻找类似的页面。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈