姓名:李涓子

职称:教授

电话:62781461

邮箱:lijuanzi@tsingua.edu.cn

个人主页:http://keg.cs.tsinghua.edu.cn/persons/ljz

教育背景

工学学士 (计算机科学与技术), 山西大学, 中国, 1986;

工学硕士 (计算机科学与技术), 山西大学, 中国, 1989;

工学博士 (计算机科学与技术), 清华大学, 中国, 2000.

社会兼职

清华大学计算机科学与技术系软件研究所: 副所长 (2004-);

中国计算机学会: 中文信息技术专业委员会 (2010-)

Asian Semantic Web Conference (ASWC): 指导委员会委员 (2007-2009);

ASWC 2006: 本地组织委员会主席 (2006).

研究领域

语义Web, 语义Web服务;新闻与社会网络挖掘

研究概况

我于2000年在清华大学获得博士学位,2001年博士后出站后留校工作至今。我的科研工作特点是融合语义Web、文本与社会网络挖掘技术,研究基于语义的内容管理关键技术,并应用于包括新闻、研究者社会网络和Web服务在内的多个领域。主要工作包括:

1. 基于语义的内容管理关键技术。在本体映射研究中,提出基于贝叶斯决策的多策略本体映射模型,解决了多种映射策略的融合问题;提出动态选择的多策略本体映射模型,解决了针对不同本体映射任务,动态选择映射策略的问题,并进一步提高了映射精度。研究成果发表在SIGMOD、Journal of Web Semantics(JoWS)和TKDE等国际重要学术期刊和会议上 。据Google Scholar统计,发表在JoWS上的论文被引用73次。在语义标注研究中,针对标注对象所具有的不同特点,研究不同的语义标注方法,提出基于规则、分类模型和序列模型的条件随机场的三类语义标注方法。这些标注方法已经成功应用于研究者个人信息、会议信息和公司信息的语义标注中,取得了良好的应用效果。上述研究工作得到国家自然科学基金和973项目的支持。

2. 新闻与社会网络挖掘。在新闻挖掘中,提出基于索引树和命名实体的话题发现和跟踪模型、基于话题的新闻分析模型,研究成果发表在SIGIR 2007,并在SIGKDD 2009上做demo演示;在社会网络挖掘研究中,提出面向专家的研究者社会网络搜索模型,并对专家发现、研究兴趣发现和会议挖掘等问题进行了深入研究。

3. 新闻领域XML数据处理应用研究。我是国家标准 “中文新闻信息标识语言(CNML)”(GB/T20092-2006)的第四起草人,并作为项目负责人,承担了CNML标准管理系统的研制任务。目前,该软件部署在新华社文字编辑系统、图片编辑系统、信息部多媒体编辑系统、多媒体数据库、视音频编辑系统、产品生成系统等重要业务系统中,全面满足了技术建设和日常运维的需求。该项目获得“2009年王选新闻科学技术进步二等奖”。

研究课题

国家自然科学基金项目: 大规模动态本体映射模型研究 (2010-2012);

国家自然科学基金项目: 限定领域中基于语义的内容管理的关键技术及应用 (2006-2008);

国家自然科学基金项目: 分布式本体系统中本体粒度划分机制研究 (2004);

973二级课题: 需求模型验证与管理 (2008-2012);

新华社项目: “中文新闻信息置标语言CNML”标准管理系统 (2007-2008);

国家环境保护部项目: 处置环境与核恐怖袭击事件应急项目——核与辐射环境数据交换技术规范与应用接口开发 (2009-2011);

IBM国际合作项目: 智慧城市中集群体智慧的数据间关联关系挖掘 (2010-2011);

IBM国际合作项目: 基于主动学习的大规模本体映射的语义集成方法研究 (2009-2010);

IBM国际合作项目: 分布知识库查询关键技术 (2008-2009);

IBM国际合作项目: 语义内容管理关键技术 (2007-2008);

“清华—鲁汶”国际合作研究项目: Webinsight:万维网文档关联和演化分析模型研究 (2009-2011).

国家自然科学基金重点项目:基于云计算的海量数据挖掘关键技术 (2011-2014)

新华社项目:“中文新闻信息置标语言CNML”标准管理系统升级 (2010-2011)

奖励与荣誉

王选新闻技术科技进步二等奖——CNML标准管理系统 (2009).

学术成果

[1] Zi Yang, Jie Tang, Juanzi Li, Social Community Analysis via Factor Graph Model. IEEE Intelligent Systems. (accepted)

[2] Ali Daud, Juanzi Li, Lizhu Zhou, and Faqir Muhammad. Temporal Expert Finding through Generalized Time Topic Modeling. Knowledge Based System Journal. (Accepted)

[3] Zhifeng Gu, Bin Xu, Juanzi Li, Service Data Correlation Modeling and Its Application in Data-Driven Service Composition, IEEE Trans. Service Computing. (Accepted)

[4] Juanzi Li, Jie Tang begin_of_the_skype_highlightingend_of_the_skype_highlighting, Yi Li, Qiong Luo: RiMOM: A Dynamic Multistrategy Ontology Alignment Framework. IEEE Trans. Knowl. Data Eng. 21(8): 1218-1232 (2009)

[5] Gang Wu, Juan-Zi Li, Jianqiang Hu, Kehong Wang: System Pi: A Native RDF Repository Based on the Hypergraph Representation for RDF Data Model. J. Comput. Sci. Technol. 24(4): 652-664 (2009)

[6] Jie Tang, Juanzi Li, Bangyong Liang, Xiaotong Huang, Yi Li, and Kehong Wang, Using Bayesian Decision for Ontology Mapping. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, Vol(4) 4:243-262, December 2006.

[7] Qian Zhong, Hanyu Li, Juanzi Li, Guo Tong Xie, Jie Tang, Lizhu Zhou and Yue Pan: A Gauss Function based Approach for Unbalanced Ontology Matching. Proc. 35th International Conference on Management of Data(SIGMOD2009), Providence, Rhode Island, USA, 2009: 669-680.

[8] Feng Shi, Juanzi Li, Jie Tang, Guotong Xie, Hanyu Li, Actively Learning Ontology Matching via User Interaction, Proc. 2009 International Semantic Web Conference (ISWC2009), Washington D.C, USA, 2009 : 585-600.

[9] Ali Daud, Juanzi Li, Lizhu Zhou, and Faqir Muhammad. Conference Mining via Generalized Topic Modeling. Proc. International European Conference on Machine Learning and Principles and Practices of Knowledge Discovery in Databases (ECML PKDD2009), Bled, Slovenia, 2009: 244–259.

[10] Gang Wu, Juanzi Li, Ling Feng, Kehong Wang, Identifying Potentially Important Concepts and Relations in an Ontology, Proc. 2008 International Conference on Semantic Web (ISWC2008), Karlsruhe, Germany, 2008:33-49

[11] Xin Xin, Juanzi Li, Jie Tang, Qiong Luo, Academic Conference Homepage Understanding Using Constrained Hierarchical Conditional Random Fields, Proc. the 17th ACM Conference on Information and Knowledge Management(CIKM2008), Napa Valley, California, 2008: 1301-1310

[12] Zhifeng Gu, Juanzi Li, Bin Xu, Automatic Service Composition Based on Enhanced Service Dependency Graph, Proc. the IEEE International Conference on Web Services (ICWS2008), Beijing, China, 2008: 246-253

[13] Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, and Zhong Su. Extraction and Mining of Academic Social Network. Proc. Fourteenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (SIGKDD2008), Las Vegas, Nevada, USA, ACM 2008: 990-998.

[14] Kuo Zhang, Juanzi Li, Gang Wu, Event Detection Based on Indexing-tree and Named Entity, Proc. 30th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval(SIGIR2007), Amsterdam, The Netherlands, ACM 2007: 215-222

[15] Duo Zhang, Jie Tang, Juanzi Li, and Kehong Wang. A Constraint-Based Probabilistic Framework for Name Disambiguation. Proc. Sixteenth Conference on Information and Knowledge Management (CIKM2007), Lisbon, Portugal.: 1019-1022

[16] Jie Tang, Mingcai Hong, Juanzi Li, Bangyong Liang, Tree-structured conditional random fields for semantic annotation, Proc. 5th International Conference of Semantic Web (ISWC2006). Athens, GA, USA:640-653.