复旦大学  
更多 

个人简介






谈子敬计算机科学技术学院副教授、博士。中国计算机学会、ACM、IEEE 会员。先后于复旦大学计算机软件与理论专业获得理学学士、理学硕士和理学博士学位。曾作为访问学者在英国爱丁堡大学访问一年。


主要研究兴趣是大数据管理和机器学习的相关/交叉领域。属于学院的大数据与数据科学学科方向

我的研究主要围绕计算机科学的两个重要领域:大数据管理和机器学习。关注于如何使用机器学习的方法手段来解决数据管理的问题;也关注如何开发、设计数据管理系统为机器学习提供支持。

针对大数据管理的机器学习技术:

大数据管理通常针对数据的3Vs (variety, volume, velocity)特性。我们对于相关的研究领域:(1)多数据类型和多数据源(variety),研究图数据管理,数据交换和集成等课题;(2)海量规模(volume):研究分布式计算技术,MapReduce,Hadoop,Spark,HBase相关技术;(3)动态数据特征(velocity):研究流数据管理,增量计算技术。在实际数据管理中,数据质量问题越来越受到人们的关注,数据质量的高低直接影响最终分析结果的优劣。在(4)数据价值(value)、数据真实性(veracity):我们研究数据约束、数据清洗、一致查询回答等问题。

我们特别关注如何使用机器学习的技术以改善数据质量,一些进行中和预期的课题包括:使用机器学习来进行实体识别、数据清洗、模式分析等。

针对机器学习技术的数据管理:

机器学习越来越多地被用于从数据中获取有价值的信息。在机器学习的应用中,实际上是需要一个高效和完整的pipeline工作,其中的很多步骤都涉及数据管理的内容。由于现有的如Tensorflow, PyTorch等工具包的存在,模型训练通常并不是那么困难。但是如何获取高质量的训练数据集,如何选取高质量的特征值,如何解释和评估模型变得更为重要。我们特别关注如何使用数据管理的技术为机器学习服务,相关的进行中和预期的课题包括:自动训练数据生成,针对训练数据的数据清洗等。


近年来发表了多篇高质量的论文,包括国际会议(SIGMOD,VLDB,ICDE,DASFAA,IJCAI等),SCI索引期刊(Elsevier出版期刊Information Sciences,Journal of Systems and Software, Information and Software Technology等)和国内权威期刊(软件学报等)。曾先后主持和参加国家自然科学基金、863等国家、省部级和其他各类科研项目多项。


给学生的建议

1. 我会有充足的时间和精力放在你身上,确保充分的交流和沟通。我会帮助你科研选题,建立模型,分析、设计和实现算法,设计实验,写作论文,或者通过各种形式一起思考人生。。。我不会仅仅把你散播在那里,等着你自己生长,而是会用心认真地帮助你。但你还是需要努力的。。。

2. 我会尊重和宽容地对待你;每个学生的预期目标和承受能力不同,我尊重这一事实,但你提高和进步的程度和你的预期目标和承受能力密切相关。

3. 你应该对科研有热情和兴趣,有一定的数学、编程和英语能力,有比较强的自我管理能力。我不会给你很多压力,我希望你的进步和提高让我觉得指导你有压力。

4. 欢迎对科研/工程有兴趣的学生。个人以为在研究生阶段从事科研是个很不错的体验。即使你选择的是专业硕士,我会为你提供足够的科研机会,只要你有兴趣。

5.学生可以达到怎么样的程度?我们最近发表的四篇一区会议论文VLDB 2020,ICDE 2020,ICDE 2021,ICDE 2022属于数据库三大会议。它们都是由硕士学生和我合作完成的。在满足前面第3条的基础上,每个同学都有很好的机会。我和每位同学在论文中都是合作者关系,会努力贡献自己的力量。


已经毕业的学生和他(她)们的第一份工作

朱永俊(2011/百度); 张立勇(2012/创新工场); 陈垚亮(2012/IBM研究院);何楚(2015/腾讯,一等奖学金);陈卿(2016/QCRI 卡塔尔计算所,华为奖学金,董氏东方奖学金);邱宇(2019/字节跳动,一等奖学金);覃昇(2020/复旦大学附属中学,国家奖学金);朱琳(2020/腾讯,国睿奖学金);张鸿翔(2020/浙商证券); 冉艾(2020/美团)朱云鹏(2021/拼多多);孙旭(2021/拼多多);金一峰(2021/阿里巴巴,国家奖学金);江嗣嘉(2022/腾讯);曾伟俊(2022/腾讯);张岳(2022/腾讯);许昊南(2022/华为)


联系我:



  • 教育经历
  • 工作经历
  • 研究方向
  • 社会兼职
    暂无内容
    暂无内容
    暂无内容
    暂无内容

团队成员

暂无内容