教育房产时事环球科技商业
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

微软清华公布数据集匹配准确率超过98!

  清华大学副教授、Arnetminer 创始人唐杰博士在微博上更新了清华和微软在 KDD 上公布的最新成果——Open Academic Graph。
  「我们和微软在 KDD 上发布了一个非常大的学术数据,包含有微软 1.6 亿论文和 AMiner 里面抽取出来 1.55 亿论文,同时还给出了这两个数据之间的链接关系(可以用于做数据集成研究),欢迎大家下载,这也是清华和微软等单位联合成立的开发学术社区 Open Academic Society 。」
  据雷锋网 AI 科技评论了解,该数据集仅供科研用,包含了 Microsoft Academic Graph (MAG) 的 1.66192182 亿篇论文及 AMiner 的 1.54771162 亿篇论文。研究者生成了两个学术图表的 6463 万个链接关系(matching),并表示在未来会呈现包括作者在内的更多链接结果。这个数据集可以用于进行引用网络(citation network)、论文内容等多种数据集成研究。整个数据集包括以下三个方面,即链接关系、MAG 论文集及 AMiner 论文集。
  在链接关系中,两个数据集的论文会以 ID 的形式呈现,例:
  {
  "mid": "xxxx",
  "aid": "yyyy"
  }
  其中,mid 指的是 MAG 的论文 ID,而 aid 则是 AMiner 的论文 ID。
  对于数据集 MAG 论文和 AMiner 论文而言,每篇论文都是一个 JSON 对象。其数据模式是:
  示例如下:
  在使用的时候,研究者可以通过以下两步进行操作:
  1. 采用 Microsoft Graph Search API 查询每个 AMiner 的论文标题,并且筛选出对应的链接论文。2. 如果两篇论文满足以下条件,则会被链接起来:
  1)标题相似;2)作者数目相同;3)有类似的作者名字及 4)相同的出版年份。
  在测试过程中,研究者以 24012(TODO)链接论文对在数据集上进行测试,能够正确匹配的论文对有 23859 份,准确度达到 99.36%。
  在 Open Academic Society 官网上,研究者又提供了一份准确率的最新数据:他们将 4100 个研究对进行准确性测试,发现有 4029 个成功匹配,准确率达到了 98.27%。
  该数据集能够在 cloud API 上免费获得。如唐杰博士所言,这个数据集将成为 Open Academic Society 学术社区的重要组成部分。Open Academic Society 旨在建立一个共享、开源且不断扩展的知识图表体系,并构建以教育为核心的实体关系。以微软研究院旗下的 Microsoft Academic 和清华大学的 AMinergraph 领衔,知识图表的不断发展也得益于社区成员的持续贡献。
  Open Academic Society 目前的成员包括 22 位老师/研究机构,也有不少华人,包括亚利桑那州立大学刘欢教授、澳大利亚国立大学 Lexing Xie博士、中科院程学旗博士、清华大学唐杰博士、UCLA 的 Yizhou Sun 博士、伊利诺伊大学厄巴纳-香槟分校 的 Chengxiang Zhai 等老师。

新版MicrosoftDefender预览版应用在微软商店出现微软似乎正在为Windows10和Windows11PC测试一个新的MicrosoftDefenderPreview应用程序。本周早些时候,AggiornamentiLumia发现苹果再推迟MacBookPro定制机型客户的到货时间一些上周预购了苹果新MacBookPro并承诺10月26日交货的客户,今天醒来后发现该公司的电子邮件莫名其妙地指出,他们的Mac实际上要到12月才会到达。随着新的MacBookPr微软或正为教育市场准备新款低价Surface笔记本电脑随着近年来Chromebook在美国教育市场上的地位不断提高,微软可能正准备更进一步,以确保WindowsPC在这一市场保持相关性。根据WindowsCentral的一份新报告,微英特尔i512600KAlderLakeS处理器CPUZ信息曝光伴随着Intel7(此前称之为10nmEnhancedSuperFin,10ESF)的出现,英特尔即将推出的AlderLakeS阵容将提供新的混合技术,将新的大核心和小核心混合到一苹果美国官网显示1416英寸新款MacBookPro的交付日期已经延迟到11月底12月初了。在美国当地时间周日上午,14英寸MacBookPro基础款的预估交付日期为11月1623英特尔第14代MeteorLake计算模块亮相性能达到预期本周早些时候,英特尔表示下一代MeteorLake处理器将启用单计算模块(ComputeTileComputeDie)。早在今年3月,英特尔的首款7纳米计算模块就开始流片,这标志着再有传闻称2022年MacBookAir采用miniLED显示屏据DigiTimes报道,苹果的下一代MacBookAir将采用miniLED显示屏,并在2022年推出。DigiTimes此前称,MacBookAir未来将采用miniLED显示首批MacBookPro预购即将发货苹果正努力满足需求新款MacBookPro型号的最早预购现在正准备发货,该公司对所有新订单的发货日期一直预估在三到四周之间。新款MacBookPro型号的发货日期在预购开始后几分钟内就出现了推后。现英特尔酷睿i712700K和酷睿i912900K定价泄露美国计算机元件和电子产品商店MicroCenter似乎已经抢先一步,在正式销售开始前近两周在其网站上列出了即将推出的英特尔酷睿i712700K和酷睿i912900K的定价。这应该是本周早些时候,苹果公司发布了14英寸和16英寸的新款MacBookPro机型。现在,在Reddit社区上有网友率先分享了搭载M1Pro的14英寸MacBookPro的开箱。此外油管德国零售商抢跑酷睿i912900K网友610美元入手按照计划,英特尔会在下周正式发布12代AlderLake台式CPU。然而没想到的是,一些幸运客户已经提前拿到了零售版的i912900K处理器,并且在网络上分享了完整的开箱图片。Vi
苹果女粉丝开箱SurfaceBook2令人印象深刻SurfaceBook2已经在全球多地上线发售,诸多科技频道和用户纷纷在社交平台上晒出了开箱和初步上手视频。下面这段更有趣的开箱来自于YouTube频道iJustine,她是非常知超麒麟970!Intel发全球最快4G基带XMM76601。6Gbps根据StrategyAnalytics的统计,2016年的基带市场,排名前五的厂商分别是高通联发科三星LSI展讯和海思。虽然没有Intel的份,但通过苹果从iPhone7之后的强力Intel发布全球最快4G基带XMM76601。6Gbps根据StrategyAnalytics的统计,2016年的基带市场,排名前五的厂商分别是高通联发科三星LSI展讯和海思。虽然没有Intel的份,但通过苹果从iPhone7之后的强力苹果女粉丝开箱SurfaceBook2令人印象深刻SurfaceBook2已经在全球多地上线发售,诸多科技频道和用户纷纷在社交平台上晒出了开箱和初步上手视频。下面这段更有趣的开箱来自于YouTube频道iJustine,她是非常知Intel发布5G基带XMM8060全网通兼容国内频段明年的平昌冬奥会将是5G规模性场内外商用的第一个窗口期,昨天,工信部也正式划分了中国的5G承载频段,规划33003600MHz和48005000MHz。据外媒报道,Intel今天宣SSD也不行了?三季度出货量全面暴跌大容量为王PC行业这几年进步相对迟缓,唯有SSD固态硬盘领域一直充满蓬勃生机,技术创新也不断涌现,但是根据市调机构TrendFocus的最新数据,2017年第三季度的全球SSD出货量却出现了首位八代APU笔记本买家诞生AMD自家老大AMD已经公布了有关于八代APU的性能,同时表示首批搭载APU的笔记本已经开始销售,而现在首位购买AMD第八代APU的买家已经现身,就是AMD的CEO苏姿丰。AMDCEO苏姿丰女士3DMark公布VRMarkCyanRoom采用DX12开发11月16日消息,3DMark在今天宣布即将推出全新的VR测试项目也就是VRMarkCyanRoom,据悉这个项目将会使用DX12引擎进行编写,能够有效地测试显卡的图形性能以及VRQ3全球笔记本出货4269万台联想份额第2苹果第411月16日消息,据国外媒体报道,市场研究机构的数据显示,三季度全球笔记本共出货4269万台,联想市场份额依旧排在第2位,苹果则已超过华硕,升至第4。发布三季度全球笔记本出货量报告GitHub宣布新版Atom文本编辑器支持实时代码协作自三年前推出以来,GitHub的Atom文本编辑器已经争取到了可与SublimeText等选手比肩的地位,成为了开源编程者们的一个强大选择。如果此前影响你采用的只是ldquo不支持新款苹果iPadPro将配八核A11X芯片支持面容ID11月16日消息据AppleInsider报道,预计将于明年发布的新款iPadPro将搭载A11仿生芯片的强化版本mdashmdashA11X,并且支持面容ID。相比于A11芯片2