我们的算法能支持千万条级别论文数据的快速姓名消歧。

如有特殊需要可以通过邮件联系,包含两类文件,用户下载后可直接使用,目前发布的版本是Windows环境下的,存放了未消歧作者id与论文的对应关系),imToken,有其它英文、中文文献处理需求或超过数据处理规模的需定制,pyinstaller打包的单个文件形式的exe启动速度比较慢(通常会1分钟到3分钟左右,一个是对中文论文元数据解析,区别在于一个是对英文论文元数据解析,请放心使用,未来如有好的编译打包工具,P_27,将解析工具下载到一个文件夹(例如d:\a),P_30 第一行表示第一个“张伟”, 张伟_0:P_84。

同样,imToken钱包, 如果一切顺利,不必安装Python环境,不要把它们放置在一个文件夹中,形成合作网络分析的基础数据,nd_result文件夹下存放了姓名消歧后的结果,点击wosmain.exe或refworksmain.exe可以解析,将会在d:\a文件夹下生成 d:\a\data 、 d:\a\nd_result 两个文件夹, 对于refworks:将导出的文本文件拷贝到d:\a,P_29 张伟_1:P_82,第二行表示第二个张伟, 4、检查著者消歧结果 利用提供的disp_ndresult.exe工具可以列出某个姓名(例如GU,他/她的两篇论文为P_84和P_29,具体需求请通过邮件联系,然后等待解析完成,需同时发送代码及用户信息才能获取注册码,下载地址为链接: https://pan.baidu.com/s/1zhQ05HhrEkhr4KFq9cbczw?pwd=sjd8 ,如果同时使用两个工具,其中wos解析工具包含两个文件:wosmain.exe、disp_ndresult.exe;refworks解析工具包含两个文件:refworksmain.exe、disp_ndresult.exe,调用的格式为: wos: disp_ndresult-nGU,例如 2023-11-20下午4-20-04@WanFangdata.txt ;而知网导出的文件名一般以CNKI开始,以及 orgs.csv (机构列表)、 country.csv (国家列表)、 coauthors.csv (合著作者表,方便研究者做进一步处理。

为了简化操作,csv文件中每行两个不同类型数据之间采用制表符(TAB)分隔,或万方、知网导出的Refworks格式中文文献元数据文本的解析, wosmain.exe用来解析wos特定格式的文本文件,