颜聿辰

杭州, 浙江 · +86 - 195 5010 7856 · yanyuchen@zju.edu.cn

用人工智能技术赋能人类生活！

教育经历 📕

浙江大学

在读研究生

人工智能专业

研究方向:大语言模型、自然语言处理

2022年 9月 - 至今

北京师范大学

学士学位

信息管理与信息系统（主修）

数据科学与大数据技术（辅修）

国家奖学金、北京市优秀毕业生

2018年 9月 - 2022年 6月

论文成果 📝

S^3c-Math: Spontaneous Step-level Self-correction Makes Large Language Models Better Mathematical Reasoners

AAAI 2025

- 将自发分步自纠错能力引入大语言模型，提升模型数学推理能力

- 在GSM8K、MATH等多个数学评估基准上提升较为显著

Triad: A Framework Leveraging a Multi-Role LLM-based Agent to Solve Knowledge Base Question Answering

EMNLP 2024 Main

- 将KBQA分解为问题解析、实体链接、查询构建和答案生成四个阶段，在每个阶段设计一个基于 LLM 的端到端解决方案，完成KBQA的全流程

- 在不使用训练集的情况下，取得多个KBQA数据集的SOTA

SciGraph: A Knowledge Graph Constructed by Function and Topic Annotation of Scientific Papers.

EEKE@JCDL22

- 设计功能词汇识别算法和主题词上下位关系计算方法

- 对1203个科技领域下的90万篇科技论文进行自动功能标引和主题标引

- 构建科技论文知识图谱，包含 190 万节点和 1640 万关系

项目经历 🔧

面向跨媒体内容管理的智能分析与推理

科技创新2030-“新一代人工智能”重大项目

- 千万级商品知识库上的多模态检索

- 使用CLIP,高效提取商品文本特征与视觉特征

- 使用Faiss构建向量检索索引,检索时间低于0.5s,准确率不低于85%

2022年 9月 - 2024年1月

面向领域知识组织的科技论文多维度标引

本科毕业论文

- 设计功能词汇识别算法和主题词上下位关系计算方法

- 对1203个科技领域下的90万篇科技论文进行自动功能标引和主题标引

- 构建科技论文知识图谱，包含190万节点和1640万关系

- 设计基于知识图谱的科技论文检索系统，支持学者的探索型检索需要

- 发表论文：Yan, Y., & Chen, C. SciGraph: A Knowledge Graph Constructed by Function and Topic Annotation of Scientific Papers[C]. EEKE@JCDL2022.

2021年 11月 - 2022年 6月

领域术语识别与面向技术主题的术语规范化研究

富媒体数字出版内容组织与知识服务重点实验室开放基金项目

- 构建术语共现网络和术语语义网络

- 依据生成的网络形成术语的层次概念体系

- 基于层次概念体系,梳理概念粒度,完成术语概念规范化

2022年 5月 - 2022年 12月

面向科研人员定量评价的多维学术专长识别及属性度量研究

国家社会科学基金项目

- 负责基于语义的知识实体提取和实体链接

2021年 9月 - 2022年 6月

科技创新数据服务相关模型及算法研发

科技部中国科学技术信息研究所委托横向项目

- 在550万篇科技论文上进行中图分类、主题词推荐、实体推荐等任务

2021年 6月 - 2022年 6月

基于深度学习方法的国内突发公共卫生事件的网络谣言识别模型及特征研究

北京市级大学生创新创业训练计划项目

- 爬取新冠疫情相关网络谣言，分析谣言特征，提出公信指数、微博影响力等深层特征

- 构建基于BERT的文本模型，并与情感模型、用户与传播模型集成，F1值达0.93

- 发表论文：颜聿辰,郑婧林,李轶楠,陈翀. 基于多维特征和集成学习的网络谣言识别研究. 2021年中国情报学年会.

2020年 6月 - 2021年 6月

个人技能 🎯

编程语言 & 工具

编程技能

熟练使用 Python、MySQL、Java
熟悉Pytorch深度学习框架
熟悉HuggingFace提供的一系列自然语言处理Pipeline
熟练简单网页前端设计(Vue & Element UI)与后端(Spring Boot)编写
了解Neo4j图数据库, 了解RDF图数据库