c-dblp 系统开发报告
DESCRIPTION
C-DBLP 系统开发报告. 2008.7.26. Outline. C-DBLP 系统介绍 C-DBLP 开发进度 C-DBLP 数据集成 C-DBLP 界面设计 C-DBLP 功能规划 总结及展望. 个人信息空间. C-DBLP. DBLP. C-DBLP 系统介绍. 设计初衷: 为中文文献建立集成数据库 用户为中心的信息平台. C-DBLP 系统介绍. 第一阶段目标 实现一个类似 DBLP 的以研究者为中心的中文论文信息系统。 第二阶段目标 实现更多信息的 Mashup ,提供以用户为中心的更加丰富的信息展示。. Outline. - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/1.jpg)
C-DBLP系统开发报告
2008.7.26
![Page 2: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/2.jpg)
Outline
C-DBLP 系统介绍 C-DBLP 开发进度 C-DBLP 数据集成 C-DBLP 界面设计 C-DBLP 功能规划 总结及展望
![Page 3: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/3.jpg)
C-DBLP系统介绍设计初衷:
为中文文献建立集成数据库 用户为中心的信息平台
DBLP
C-DBLP
个人信息空间
![Page 4: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/4.jpg)
C-DBLP系统介绍 第一阶段目标 实现一个类似 DBLP 的以研究者为中心的中文
论文信息系统。 第二阶段目标 实现更多信息的 Mashup ,提供以用户为中心
的更加丰富的信息展示。
![Page 5: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/5.jpg)
Outline
C-DBLP 系统介绍 C-DBLP 开发进度 C-DBLP 数据集成 C-DBLP 界面设计 C-DBLP 功能规划 总结及展望
![Page 6: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/6.jpg)
C-DBLP开发进度 7 月 4 ~ 12 日
设计数据库模式 规划网站结构 确定待集成数据源
7 月 13 日~ 20 日 各个期刊数据源的集成 网站界面设计 网站功能实现
7 月 21 日~ 24 日 注册域名 cdblp.cn 在服务器上部署网站 网站界面、功能修改完善
系统规划阶段
系统开发实施
功能整合完善
![Page 7: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/7.jpg)
Outline
C-DBLP 系统介绍 C-DBLP 开发进度 C-DBLP 数据集成 C-DBLP 界面设计 C-DBLP 功能规划 总结及展望
![Page 8: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/8.jpg)
C-DBLP数据集成 数据定位:
计算机权威期刊 国内重要会议文献
延续采用 JobTong 的数据爬取技术
![Page 9: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/9.jpg)
C-DBLP数据集成 已集成的数据情况:
目前已从中国知网上集成 2004年以后的期刊数据 18373条 9 大计算机核心期刊:
软件学报 计算机学报 计算机研究与发展 计算机工程 中国图象图形学报 中文信息学报 计算机科学 小型微型计算机系统 计算机科学与探索
![Page 10: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/10.jpg)
C-DBLP数据集成:数据清洗 爬取数据的不规范
手工整理 9 条 多个属性信息的分割 有效信息的提取
拼接上头部: http://www.cnki.com.cn/downValidate/InitCode.aspx?q
![Page 11: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/11.jpg)
C-DBLP现有数据的问题 存在少数数据不规整
网页爬取时存在一些序言、征文通知等干扰数据 考虑的解决方法:手工清理
某些期刊内容不完整,论文数据有些项缺失 网络和服务器负载能力的影响 考虑的解决方法:用检测程序对已集成的和部分为抽取的数
据进行补全 目前只集成了 2004 年以后的期刊数据
根据需要对 2004 年以前的数据进行抽取 会议文献集成有一定困难,目前尚空缺这方面的数据
![Page 12: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/12.jpg)
Outline
C-DBLP 系统介绍 C-DBLP 开发进度 C-DBLP 数据集成 C-DBLP 界面设计 C-DBLP 功能规划 总结及展望
![Page 13: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/13.jpg)
C-DBLP界面设计 基于 Yaml css 框架
跨浏览器的设计 灵活的页面布局 较少的用户限制
两个分离的原则 Css 与 html 页面内容分离 Our design 和 yaml 分离
页面风格 简单清晰,二级页面结构 配色方案:主要采用灰绿色系搭配
调整 ie的 css
主要页面 css
![Page 14: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/14.jpg)
C-DBLP界面设计 一级页面
高级搜索
作者检索
![Page 15: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/15.jpg)
C-DBLP界面设计 二级页面
作者名字
年份排列的文献列表
新闻发布
![Page 16: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/16.jpg)
C-DBLP界面设计: Problems
字符集的问题 页面字符集的统一
css 覆盖的问题 yaml 框架中有些 css 无法覆盖
不同浏览器下的调试 Mozilla Firefox 、 Internet Explorer …… IE Bug :用针对 ie 的 css 做特别处理
Yaml 框架的使用
![Page 17: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/17.jpg)
Outline
C-DBLP 系统介绍 C-DBLP 开发进度 C-DBLP 数据集成 C-DBLP 界面设计 C-DBLP 功能规划 总结及展望
![Page 18: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/18.jpg)
功能展示 某用户小张,需要了解孟小峰老师发表过的文
章,小张听说过 CNKI 中国知网,也了解国外有个 DBLP 的专业文献网站,但是知网需要付费,更糟糕的是小张英文学得不好,……
彷徨中,他找到了 www.cdblp.cn
![Page 19: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/19.jpg)
功能展示小张在 C-DBLP 的首页搜索栏中输入了检索条件。
![Page 20: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/20.jpg)
功能展示
提交
小张在结果中找到了自己比较感兴趣的一篇文章,点击链接后……
![Page 21: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/21.jpg)
功能展示
点击文章链接
小张想看看软件学报 06年 10 期都有哪些文章,所以他继续点击……
![Page 22: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/22.jpg)
功能展示
这一期的软件学报没有其他小张感兴趣的内容,所以他想看看软件学报其他期的内容,所以,他点击《软件学报》
![Page 23: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/23.jpg)
功能展示 在这里,他找到了《软件学报》最近几年各期的链接。
《软件学报》有了,那么其他期刊呢?
![Page 24: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/24.jpg)
功能展示
点击“ journal”
果然,他找到了计算机领域国内出名的刊物列表。
小张注意到导航条中有一个 Conference ,于是他好奇地点击了这个链接。。
![Page 25: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/25.jpg)
功能展示 原来这是一个国内知名会议的列表。
![Page 26: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/26.jpg)
功能展示 小张想知道孟老师 2008 年有没有发表过关于Deep Web 的文章,所以他来到”高级搜索“功能。
![Page 27: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/27.jpg)
功能展示 提交查询请求后,他得到了这样的结果。
小张发现其他作者名字上有超链接,于是他尝试着点击了其中一个。
![Page 28: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/28.jpg)
功能展示 原来从这里也可以找到这位作者的文章列表。
![Page 29: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/29.jpg)
功能规划图
![Page 30: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/30.jpg)
C-DBLP功能特点(一) 以作者为中心,兼顾多样化搜索需求
系统定位:计算机领域中文文献集成系统
用户需求:基于 author 的文献检索
![Page 31: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/31.jpg)
C-DBLP功能特点(二) 个人数据空间导向
传统文献搜索:关键字、标题、作者
C-DBLP :
· 基于作者的数据集成
· 个人数据空间项目的第一步
![Page 32: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/32.jpg)
C-DBLP功能特点(三) MVC 模块化设计
良好的模块设计可以使开发事半功倍。
![Page 33: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/33.jpg)
C-DBLP功能特点(四) 检索结果缓存机制
需求:
· 数据量大
· 检索响应速度慢
·相同条件检索多
![Page 34: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/34.jpg)
C-DBLP功能特点(五) URL美化
搜索“刘伟”,得到的结果页面 URL是:
实际实现:
search_result.php?author=“刘伟“
![Page 35: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/35.jpg)
功能细节的改进Search“刘伟”
刘伟东
刘伟俭
刘伟宁
刘伟军……
Like语句匹配导致的问题
![Page 36: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/36.jpg)
Outline
C-DBLP 系统介绍 C-DBLP 开发进度 C-DBLP 数据集成 C-DBLP 界面设计 C-DBLP 功能规划 总结及展望
![Page 37: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/37.jpg)
总结及展望 功能需要改进和完善 Author 表的抽取和作者信息的集成 Conference 数据的引入 Hot Topics 的自动生成 个人数据空间的规划与实现
![Page 38: C-DBLP 系统开发报告](https://reader033.vdocuments.net/reader033/viewer/2022061322/56814e7e550346895dbc1bb0/html5/thumbnails/38.jpg)
Welcome to use our systemWelcome to use our system ,,and we really need your adviceand we really need your advice !!
Thank youThank you !!