首页 理论教育 本书创新之处:多元计量理论、相对值聚合算法

本书创新之处:多元计量理论、相对值聚合算法

时间:2023-07-08 理论教育 版权反馈
【摘要】:本书的创新之处主要包括以下3个方面:总结了科学知识多元计量的理论基础和定位,明确了多元计量聚合内涵和特性。针对基于节点和聚类的传统方法存在的局限,创新地提出了基于相对值的聚合算法,该方法能够快速、有效地发现大规模网络中全局和区域重要性资源聚合。

本书创新之处:多元计量理论、相对值聚合算法

本书的创新之处主要包括以下3个方面:

(1)总结了科学知识多元计量的理论基础和定位,明确了多元计量聚合内涵和特性。本书将科学知识多元计量聚合定位为衔接信息计量学与信息检索的纽带,并在此基础上明确了多元计量聚合的内涵,认为其多元性体现在对象类型、关联网络、测度层次、目标结构四个方面;聚合深度特征体现在从元数据到计量再到语义的发展过程中,并进一步阐述了不同类型资源特征聚合的侧重点。

(2)归纳了多元计量聚合的实施策略,构建了面向科学文献的科学知识多元计量聚合技术框架,创新地将聚合技术实施过程归纳为资源关联网络中的重要性评价、核心资源的聚合方法、资源聚合语义内涵的抽取三个核心步骤。针对基于节点和聚类的传统方法存在的局限,创新地提出了基于相对值的聚合算法,该方法能够快速、有效地发现大规模网络中全局和区域重要性资源聚合。

(3)将基于主题模型的语义揭示方法和计量分析方法结合使用,从而在语义层面实施聚合,提升了计量分析结果解释的客观性,推动了方法融合。本书从有向-无向、二值-加权的角度划分了资源特征项所构成的网络类型,结合引文网络和作者间的复合知识关联网络进行了实证研究,详细归纳了当前引文数据著录不规范和作者数据著录不规范的典型特征,提出了相应的数据清洗办法;发现主题模型的分析结果可以避免作者直接面向大量无序资源,以更加客观的结果来进行聚合结果的理解和内容的解读,从而避免了传统分析过程中结果的揭示主要依赖于方法使用者本身认知的局限性,具有重要的实践意义和应用价值。

【注释】

[1]维克托·迈尔-舍尔维恩,肯尼斯·库克耶.大数据时代:生活、工作与思维的大变革[M].盛海燕,周涛,译.杭州:浙江人民出版社,2013:39.

[2]中华人民共和国国务院.2014年政府工作报告[EB/OL].[2014-3-9].http://house.people.com.cn/n/2014/0305/c164220-24535612-6.html.

[3]国务院办公厅.文化产业振兴规划[EB/OL].[2013-9-15].http://www.gov.cn/jrzg/2009-09/26/content_1427394.htm.

[4]中共中央办公厅,国务院办公厅.国家“十二五”时期文化改革发展规划纲要[EB/OL].[2013-9-15].http://www.gov.cn/jrzg/2012-02/15/content_2067781.htm.

[5]张晓林.颠覆数字图书馆的大趋势[J].中国图书馆学报,2011,37(5):4-12.

[6]贺德方,曾建勋.基于语义的馆藏资源深度聚合研究[J].中国图书馆学报,2012(4):79-87.

[7]Lynch C.Big data:How do your data grow?[J].Nature,2008,455(7209):28-29.

[8]Jim Gray.e-Science—A Transformed Scientific Method[EB/OL].[2013-09-20].http://research.microsoft.com/en-us/um/people/gray/talks/NRC-CSTB_eScience.ppt.

[9]Hey T,Trefethen A E.Cyberinfrastructure for e-Science[J].Science,2005,308(5723):817-821.

[10]Newman M E J.The structure of scientific collaboration networks[J].Proceedings of the National Academy of Sciences,2001,98(2):404-409.

[11]Marion L S,Garfield E,Hargens L L,et al.Social network analysis and citation network analysis:Complementary approaches to the study of scientific communication.Sponsored by SIG MET[J].Proceedings of the American Society for Information Science and Technology,2003,40(1):486-487.

[12]Tang J,Zhang J,Yao L,et al.ArnetMiner:Extraction and mining of academic social networks[C]//Proceedings of the 14th ACM SIGKDD international conference on knowledge discovery and data mining.ACM,2008:990-998.

[13]Thomson Reuters.引证关系图[EB/OL].[2013-10-05].http://images.webofknowledge.com/WOKRS512B4.1/help/zh_CN/WOS/hp_citation_map.html.

[14]中国知网[EB/OL].[2013-10-09].http://www.cnki.net.

[15]Thomson Reuters.Web of Science[EB/OL].[2013-10-09].http://webofknowledge.com/WOS.

[16]Robert Tarjan.Depth-first search and linear graph algorithms[J].SIAM Journal on Computing,1972,1(2):146-160.

[17]全国哲学社会科学规划办公室.2011年度国家社会科学基金重大项目(第二批)招标公告[EB/OL].[2013-10-10].http://www.npopsscn.gov.cn/GB/219468/15121071.html.

[18]全国哲学社会科学规划办公室.2012年度国家社会科学基金重大项目(第四批)招标立项名单[EB/OL].[2013-10-10].http://www.npopsscn.gov.cn/n/2012/1231/c219469-20065843.html.

[19]国家图书馆数字战略研究课题组.国家图书馆数字战略研究[M].北京:国家图书馆出版社,2011:1,175.

[20]刘明辉,张志平,张新民.网络资源聚合方法探析[J].机械管理开发,2008,23(5):170-172.

[21]李寰,贾保先.基于RSS聚合和本体检索的数字图书馆个性化门户设计[J].情报杂志,2009,28(2):47-49.

[22]邓胜利.信息聚合服务的发展与演变研究[J].情报资料工作,2012(1):79-83.

[23]青秀玲,译.未来新兴关键技术、挑战与趋势——2008年Horizon报告要点[EB/OL].[2013-10-09].http://joinus.las.ac.cn/research/doc/oversea/14.pdf.

[24]王菲菲.基于计量分析的数字资源语义化研究[D].武汉:武汉大学,2013.

[25]贺德方,曾建勋.基于语义的馆藏资源深度聚合研究[J].中国图书馆学报,2012(4):79-87.

[26]黄传慧,李娟.我国图书馆数字资源整合研究[J].图书与情报,2009(4):66-69.

[27]马文峰.数字资源整合研究[J].中国图书馆学报,2002,28(4):64-67.

[28]肖希明,唐义.国外多领域数字资源整合研究进展[J].中国图书馆学报,2013(4):26-35.

[29]牟冬梅.数字图书馆知识组织语义互联策略及其应用研究[D].长春:吉林大学,2009.

[30]姚崇东.基于XML的多源异构数据集成的实现方法研究[D].哈尔滨:哈尔滨工程大学,2007.

[31]张志浩.基于本体论的语义检索研究[D].西安:西安电子科技大学,2007.

[32]毛平.基于领域本体的文本信息语义检索研究[D].南京:南京理工大学,2007.

[33]邓志鸿,唐世渭.基于XML的本体表示和检索技术的研究[J].计算机工程与应用,2002,38(3):14-15.

[34]董慧,杨宁,余传明.基于本体的数字图书馆检索模型研究(Ⅰ)——体系结构解析[J].情报学报,2006,25(3):269-275.

[35]董慧,余传明,杨宁等.基于本体的数字图书馆检索模型研究(Ⅲ)——历史领域资源本体构建[J].情报学报,2006,25(5):564-574.

[36]董慧,余传明,姜赢等.基于本体的数字图书馆检索模型研究(Ⅱ)——语义信息的提取[J].情报学报,2006,25(4):451-461.(www.xing528.com)

[37]董慧,余传明,徐国虎等.基于本体的数字图书馆检索模型研究(Ⅳ)——历史领域知识推理机制[J].情报学报,2006,25(6):666-678.

[38]王翠波,张玉峰,艾丹祥等.基于语义网的信息组织与智能导航研究[J].中国图书馆学报,2006(3):32-36.

[39]唐晓波,罗毅.基于领域本体和语义相似度的数据挖掘模型[J].情报科学,2011,29(2):275-278.

[40]唐晓波,房小可.基于文本聚类与LDA相融合的微博主题检索模型研究[J].情报理论与实践,2013,36(8):85-90.

[41]唐晓波,王洪艳.基于潜在语义分析的微博主题挖掘模型研究[J].图书情报工作,2012,56(24):114-119.

[42]王曰芬,宋爽,卢宁等.共现分析在文本知识挖掘中的应用研究[J].中国图书馆学报,2007,33(2):59-64.

[43]耿骞,耿崇.利用词语共现进行Ontology的概念获取[J].现代图书情报技术,2006,133(2):43-45.

[44]毕然,吴斌.融合复杂网络科技文献分析工具综述[J].数字图书馆,2008(6):38-43.

[45]王翼,杜楠,吴斌.复杂网络在文献信息服务中的应用及实现方法[J].数字图书馆论坛,2008(6):34-37.

[46]瞿辉.面向数字资源聚合的语义化共词分析[D].武汉:武汉大学,2013:18.

[47]Rusbridge C.Towards the Hybrid Library[J/OL].[2013-10-11].D-Lib Magazine,1998,6(7/8).https://www.era.lib.ed.ac.uk/handle/1842/1736.

[48]Pacheco R C S,Kern V M,Bermejo P H S.Interoperability and information integration in an early online academic digital library of theses and dissertations:The case of BTD[J].The International Information&Library Review,2003,35(2):319-333.

[49]Doerr M,Hunter J,Lagoze C.Towards a core ontology for information integration[J].Journal of Digital Information,2006,4(1).

[50]Seligman L,Mork P,Halevy A,et al.Openii:An open source information integration toolkit[C]//Proceedings of the 2010 ACM SIGMOD international conference on management of data.ACM,2010:1057-1060.

[51]Wache H,Voegele T,Visser U,et al.Ontology-based integration of information-A survey of existing approaches[C]//IJCAI-01 workshop:ontologies and information sharing,2001:108-117.

[52]Kalfoglou Y,Schorlemmer M.Ontology mapping:The state of the art[J].The Knowledge Engineering Review,2003,18(1):1-31.

[53]Buchanan G,Bainbridge D,Don K J,et al.A new framework for building digital library collections[C]//Proceedings of the 5th ACM/IEEE-CS joint conference on digital libraries.ACM,2005:23-31.

[54]Witten I H,Bainbridge D.A Brief History of the Greenstone Digital Library Software[J/OL].[2013-10-12].http://library.nust.ac.zw/gsdl/collect/toolbox/import/Greenstone%20History.pdf.

[55]Selamat H,Wan Isa W M,Abdul Hamid J,et al.PTree:A tool to draw tree for Concept Relation Tree(CRT)[C]//Proceeding of Knowledge Management International Conference.2008:117-121.

[56]Tolle K M,Chen H.Comparing noun phrasing techniques for use with medical digital library tools[J].Journal of the American Society for Information Science,2000,51(4):352-370.

[57]Devedžic V.Semantic Web and Education[M].Springer,2006.

[58]Koper R.Use of the Semantic Web to Solve Some Basic Problems in Education:Increase Flexible,Distributed Lifelong Learning;Decrease Teacher's Workload[J/OL].Journal of Interactive Media in Education,2004(1).[2013-09-25].http://www-jime.open.ac.uk/2004/6/koper-2004-6.pdf.

[59]Garfield E,Merton R K.Citation Indexing:Its Theory and Application in Science,Technology,and Humanities[M].New York:Wiley,1979.

[60]Garfield E,Sher I H,Torpie R J.The use of citation data in writing the history of science[R].Institute for Scientific Information Inc.Philadelphia PA,1964.

[61]Garfield E.Historiographic mapping of knowledge domains literature[J].Journal of Information Science,2004,30(2):119-145.

[62]Garfield E.From the science of science to Scientometrics visualizing the history of science with HistCitesoftware[J].Journal of Informetrics,2009,3(3):173-179.

[63]Small H.Co-citation in the scientific literature:A new measure of the relationship between two documents[J].Journal of the American Society for Information Science,1973,24(4):265-269.

[64]Kessler M.Bibliographic coupling between scientific papers[J].American documentation,1963,14(1):10-25.

[65]Small H,Upham P.Citation structure of an emerging research area on the verge of application[J].Scientometrics,2009,79(2):365-375.

[66]Nallapati R M,Ahmed A,Xing E P,et al.Joint latent topic models for text and citations[C]//Proceedings of the 14th ACM SIGKDD international conference on knowledge discovery and data mining.ACM,2008:542-550.

[67]Callon M,Courtial J P,Turner W A,et al.From translations to problematic networks:An introduction to co-word analysis[J].Social Science Information,1983,22(2):191-235.

[68]冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006,32(2):88-92.

[69]Swanson D R.Fish oil,Raynaud's syndrome,and undiscovered public knowledge[J].Perspectives in Biology and Medicine,1986,30(1):7.

[70]Weeber M,Klein H,de Jong-van den Berg L,et al.Using concepts in literature-based discovery:Simulating Swanson's Raynaud-fish oil and migrainemagnesium discoveries[J].Journal of the American Society for Information Science and Technology,2001,52(7):548-557.

[71]Leydesdorff L,Welbers K.The semantic mapping of words and co-words in contexts[J].Journal of Informetrics,2011,5(3):469-475.

[72]克兰.无形学院——知识在科学共同体的扩散[M].刘珺珺等,译.北京:华夏出版社,1988.

[73]Newman M E J.The structure of scientific collaboration networks[J].Proceedings of the National Academy of Sciences,2001,98(2):404-409.

[74]Zeldman J.Designing with Web Standards[M].San Francisco:Peachpit Press,2006:4.

[75]Zhao D,Strotmann A.Can citation analysis of web publications better detect research fronts?[J].Journal of the American Society for Information Science and Technology,2007,58(9):1285-1302.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈