摘要: 1.数据部分 CodeGeeX 基于 ChatGLM 基座语言模型,所以需要关注 ChatGLM 的训练数据。 训练数据为jsonl格式,每一行的数据格式如下,其中chat_rounds字段是必需的,可以根据实际需求添加或删除其他字段。 在本项目当中,我们更加关注的是模型的单轮对话能力,所以只需要单 阅读全文
posted @ 2024-06-23 23:51 asuldb 阅读(17) 评论(0) 推荐(0) 编辑
摘要: Codeforces 数据获取 Codeforces的题目中存在一些数学公式,所以处理的时候需要比较小心的对其进行处理。 首先是题面数据,在 CF 当中标识一道题目的方式是 problemSet 与 problemId。其中 problemSet 是一个数字,而 problemId 是一个字母。 另 阅读全文
posted @ 2024-06-23 23:50 asuldb 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 1.为什么需要微调大模型? output_dir = "./results" training_args = TrainingArguments( report_to="wandb", output_dir=output_dir,#训练后输出目录 per_device_train_batch_siz 阅读全文
posted @ 2024-06-23 23:49 asuldb 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 在指导老师鹿旭东的指导下,我们将现有的工作进行总结,形成了一篇简短的论文,目前该文章已投稿至 CEISEE 2024 。 An Online Judgement System Based on Code-Generating Large Mode Abstract: For computer sci 阅读全文
posted @ 2024-06-23 23:49 asuldb 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 对于每一道题目,设置一个统计题目提交数据的页面,可以根据这个页面,来分析题目的情况。 首先对题号进行判断,如果该题目的编号超过了范围,就会显示 404 页面。 如果这是某个比赛的题目的页面,我们会根据用户的权限、题目的隐藏与否等决定是否用户可以查看该页面。 如果这是一道比赛中的题目,且比赛还没有结束 阅读全文
posted @ 2024-06-23 22:26 asuldb 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 在线评测系统的前后端都是使用 PHP进行开发的。PHP是一种广泛用于Web开发的服务器端脚本语言,有以下特点: 开源和跨平台:PHP是一种开源语言,可以在各种操作系统上运行,如Windows、Linux和macOS。这使得PHP非常灵活和可访问。 易学易用:与其他编程语言相比,PHP的语法相对简单, 阅读全文
posted @ 2024-06-23 22:24 asuldb 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 用户信息数据库: 首先,先使用: <?php echoDOJPageHeader(UOJLocale::get('modify my profile')) ?> 来显示上沿导航栏。 用户名是用户信息数据库的主键,不进行修改,所以我们主要需要提供给用户可以进行修改的信息有邮箱、密码、格言等。 首先为保 阅读全文
posted @ 2024-06-23 22:24 asuldb 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 为了提高在线评测系统的功能性,需要选择和集成一个强大的代码纠错大模型,用于自动分析和纠正用户提交的代码中的错误。 这里的大模型我们选择使用清华大学开源的 ChatGLM-CodeGeeX2。在该模型的基础上,选用程序设计试题的专门数据,进行Fine-turning的训练(即微调)。 为了令 Code 阅读全文
posted @ 2024-06-23 22:23 asuldb 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 在对模型进行部署时,可以使用魔搭默认的环境,CPU免费,GPU有使用的时间限制,需要关联阿里云的账号,因为 CodeGeeX 要用 GPU,所以先选择限制使用时长的 GPU。 在相应的模型库中选择:CodeFuse-CodeGeeX2-6B 使用教程中对应的 git clone https://ww 阅读全文
posted @ 2024-06-23 22:22 asuldb 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 主页目前的内容还是比较少的,可以 rating 排行榜上增加公告栏。 在系统的设计中,并没有单独的公告类型,而是将公告设置为重要的博客,并设置相应的置顶等级。 首页信息不宜太多,为了美观且能展示全部的信息,我们计划在首页只展示排名前5的公告。并提供一个额外的页面,可以展示所有的公告。 我们先额外编写 阅读全文
posted @ 2024-06-23 22:22 asuldb 阅读(2) 评论(0) 推荐(0) 编辑