“从非结构化数据当中提取信息,是非常重要的工作。非结构化数据可以是影像,也可以是文本。”汉斯说,将来源不同的数据与具体病例关联,进而进行研究。“这些数据需要在机器内部互相理解,比如手术报告,医生会以个性化的语言书写,除了真相外,医生还会写下他怀疑的信息,否定的信息等,如何将这些信息提取出来,进行分门别类的分析呢?”汉斯介绍,很多医疗领域从业者已经建立了很大的知识库,比如联合医疗语言系统,这是一个非常大的知识体系,有18万不同的概念,算是一个小型的“知识图谱”,作为基础架构更待共同完善。研究人员综合运用黄土-古土壤地层学、沉积学、矿物学、地球化学、古生物学、岩石磁学和高分辨率古地磁测年等多学科交叉技术方法测试了数千组样品,建立了新的黄土-古土壤年代地层序列,并在早更新世17层黄土或古土壤层中发现了原地埋藏的96件旧石器,包括石核、石片、刮削器、钻孔器、尖状器、石锤等,其年龄约126万年至212万年。