Web化学化工资源的挖掘及化学信息学

储春梅, 李晓霞, 郭力, 定向查询引擎在Web化学数据库集成检索中的应用, 计算机与应用化学, 2005, 22(8):659-666

引用格式: 储春梅, 李晓霞, 郭力, 定向查询引擎在Web化学数据库集成检索中的应用, 计算机与应用化学, 2005, 22(8):659-666
标题:定向查询引擎在Web化学数据库集成检索中的应用
作者: 储春梅, 李晓霞, 郭力;中国科学院过程工程研究所多相复杂系统国家重点实验室:高性能计算与化学信息学课题组
关键词: 定向查询引擎; 深层网; Web数据挖掘; 分布式数据库; 集成检索; XML
摘要:Internet上的化字数据库是重要的专业资源,基于超链按分析的搜索引擎还不能索引这类资源。本论文以充分利用In- ternet上的化学数据库数据为目标,将“一个查询发动多个同级检索引擎,并以结构化的方式组织信息”的方案应用于以化合物标识信息为检索入口的Web化学数据库,建立了一个基于多站点集成检索的Web数据库定向查询引擎。该引擎是一个包括用户交互层、中间检索层、数据提供层的三层Web模型。各层在系统内部分别对应于响应用户检索请求的客户端代理模块、集成远程Web信息的服务器端代理模块,以及提供缓存和检索的关系数据库模块。模型采用JSP+Java组件的开发方式, 在HTTP协议标准发送方法的基础上,采用XML技术对检索返回文档进行结构化数据的提取和表示,利用XML-DBMS实现XML数据的存储和检索,建立了一套针对深层Web数据交换的解决方案。依此方案所建立的ChemDB Portal Search实现了四个分布式Web化学数据库的有效加入、同时检索和统一显示。该系统是针对深层Web信息的挖掘和集成检索的一次尝试, 它可为其它领域建立类似的系统提供借鉴。