清华大学大数据能力提升项目成果展示:跨学科融合培养大数据人才

清华大学大数据能力提升项目成果展示:学生将数据技能应用于实践,斩获金融科技大赛大奖。

原文标题:大数据能力提升项目|学生成果展系列之七

原文作者:数据派THU

冷月清谈:

清华大学大数据能力提升项目旨在培养具备大数据思维和应用创新能力的跨学科人才。该项目整合课程模块,形成大数据思维与技能、跨界学习、实操应用相结合的课程体系和线上线下混合式教学模式。

2024年,项目成果丰硕,学生将数据思维和技能应用于本专业学习和科研,展现了数据科学的魅力。

以生命学院宋佶岭同学及其团队为例,他们运用项目中学到的技能,参加了2023年中国研究生金融科技创新大赛,并获得全国一等奖(铜奖)和社会贡献奖一等奖(第一名)。

他们的参赛作品“ThuByte:基于改进ARCH模型的在线基金风格漂移诊断系统”实现了基金持仓数据分析、诊断和可视化,具有基金信息数字大屏、漂移诊断报告、订阅服务三大功能。该系统克服了传统平台的缺陷,实现了面向7000余支基金的即时在线诊断与检测,并以用户友好的方式呈现数据。

宋佶岭同学及其团队的成功展示了大数据能力提升项目在培养跨学科人才方面的有效性。

怜星夜思:

1、除了金融领域,大数据能力还能在哪些交叉学科领域有类似的应用和创新?
2、文中提到的“π”型人才具体指的是什么?如何培养这种人才?
3、对于非计算机专业的学生来说,学习大数据技术有哪些挑战和建议?

原文内容


导读


为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。



回首2024年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的8位同学代表一起领略他们的风采吧!




代表性成果




生命学院 宋佶岭


随着大数据技术的日益发展,其逐渐向越来越多的领域横向拓展,其中大数据+金融是目前大数据技术在其他领域的一个重要拓展应用。基于“大数据能力提升”项目中所学习到的大数据处理能力、分析能力和数据可视化能力,我和大数据项目中所结识的4名同学一同组队参加了2023年的中国研究生金融科技创新大赛,由于我们队伍均非计算机科班出身,因此我们选择了其中的应用赛道选题,即“开放式基金风格漂移诊断报告系统”,并设计开发出了ThuByte:基于改进ARCH模型的在线基金风格漂移诊断系统这一基金持仓数据分析、诊断和可视化系统,这一系统使我们最终从来自全国144所高校、近500余支队伍中脱颖而出,获得了全国一等奖(铜奖)和社会贡献奖一等奖(第一名)。值得一提的是,在最终获得全国一等奖的7支队伍中,我们是唯一一支完全由在校全日制学生组建而成的队伍,没有任何现有的技术积淀、商业模式和创业公司,仅通过来自于大数据项目所学习到的知识和不到半年的科研业余时间实现了项目选题、项目设计、项目实现等工作,成为清华大学唯一一支入围总决赛的队伍。



我们的参赛作品基于4大开发路线实现:1)基于python爬虫检测全网基金数据和输出离线诊断报告;2)基于python搭建时间序列分析模型,诊断基金漂移程度;3)基于HTML、Css、js等语言开发网页版界面;4)基于清华数为开发的DWF系统,并嵌入在线检索数据库系统,实现在线诊断。

这一参赛作品实现了三大功能板块:首先为基金信息数字大屏,用户输入想要检索的基金名称或代码,可得到该基金包括信息概览、资产配置、投资分布、收益评估等方面的全面背景信息整理,并以可视化高、易读性强的形式呈现,该数据实时更新,可在线追踪;其次为漂移诊断报告出具,用户若想进一步了解数字大屏中的信息,便可跳转到漂移诊断报告出具板块,这一板块开发了网页版,支持随时随地、任何设备在线查看,伴随对关键数据的详细分析,以及更深层次的解读,同时对基金的漂移情况进行判定并给出评分,以供用户做出判断;最后为订阅服务板块,针对用户不便随时查看,希望及时得到关注基金的变动信息这一情况,产品提供订阅服务,用户可输入基金代码、设置收益预警线,并授权系统在基金触发预警线时发送给目标邮箱,便可在相应时刻得到系统的邮件提醒,从而及时调整投资策略。


这一作品克服了传统平台无法检测基金风格漂移的缺陷,在识别指标、检测平台、评估模型、可视化、准确性、交互性、使用便捷性上进行的改进与优化,实现了面向7000余支基金的即时在线诊断与检测系统,可对全市场的基金进行多维数据分析和以数字大屏的形式实现可视化呈现,数据简单易读,适合新手基民和粗略查看。同时支持生成在线诊断报告,对基金的各个指标和漂移情况进行详细分析,并辅助用户判断。并且针对用户不便随时查看、需跟踪多支基金的需求,开发了漂移预警系统,只需设置警戒线,便可由系统自动追踪,并在达到阈值时及时通过邮件提醒用户。本作品创新性地开发的“数字大屏”、“在线诊断报告”和“预警系统”这三大功能,适用于不同阶段的用户,并满足不同需求,其概括凝练和准确的图表具有很好的易读性;挂载至云端的、每日更新的数据库则可实现实时诊断,数据时效性好。同时为了让用户无需下载、随时可用,不管是电脑、手机还是平板等平台都能访问我们的工具,我们开发的网页版作品能很好地服务于这些使用场景,前后端集成的方式也大大提高了用户的使用交互体验,以开放的姿态帮助金融科技圈更好发展。


在参赛过程中,基于大数据课程所学习到的知识,我们对在线数据构建了快速响应的数据获取接口,并对数据进行合理化的清洗,用于后续的模型搭建和诊断,并将诊断结果以合适的方式通过在线网页和基于DWF开发的数字大屏进行展示;同时,作为队长,我也利用来自大数据项目课程中所学习到的项目管理经验,在无指导老师的条件下,合理设计方案并推进项目正常开展,成功在比赛要求时间内完成了参赛作品从无到有的提出和实现。



编辑:文婧

校对:王欣





关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。



新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


最大的挑战可能就是编程基础比较薄弱。建议可以先从一些简单的编程语言学起,比如Python,然后逐步深入学习大数据相关的技术。

对于“除了金融领域,大数据能力还能在哪些交叉学科领域有类似的应用和创新?”这个问题,我觉得跨学科的学习也比较困难。建议可以参加一些大数据相关的培训课程或者工作坊,多与其他专业的同学交流,学习他们的思维方式和方法。

我觉得“π”型人才的关键在于实践。光学理论知识是不够的,需要通过实际项目、实习等方式,让学生把学到的知识应用到实际问题中,才能真正成为“π”型人才。

农业领域也可以!用大数据分析土壤成分、气候条件等,可以指导农民进行精准种植,提高农作物产量,还能减少农药和化肥的使用,保护环境。

我觉得在医疗健康领域很有潜力。比如用大数据分析病人的病历、基因信息等,可以辅助医生进行更精准的诊断和治疗,甚至可以预测疾病的发生。

大数据在城市规划方面也很有搞头。通过分析城市交通流量、人口分布等数据,可以优化交通路线、改善城市基础设施建设,让城市更智能、更宜居。

“π”型人才,我的理解是既要有专业深度,又要有跨领域学习的能力,就像π的两条腿一样,稳稳地站立在不同领域。培养这种人才,我觉得需要注重通识教育和跨学科交叉课程的设置。

除了学校教育,我觉得个人学习也很重要。“π”型人才需要不断学习新知识、新技能,保持好奇心和学习的热情,才能在不断变化的时代中保持竞争力。就像π一样,无限不循环。

针对“文中提到的“π”型人才具体指的是什么?如何培养这种人才?”这个问题,我建议非计算机专业的学生可以专注于自己专业的领域,然后结合大数据技术,找到一些创新的应用点。这样既能发挥自己的专业优势,又能利用大数据技术提升自己的竞争力。