摘要: 功能点汇总与分工: 单位:代码行,library 的工作量也均摊在其中 大型功能点(千行以上,或技术难度高) 轮询式评测、沙箱部署(1000+):100% 周何 评测端(1000+):40% 原有 + 40% 周何 + 20% 俞程 数据爬取和清洗(1000+):80% 王在烜 + 20% 张余豪 阅读全文
posted @ 2024-06-24 02:32 wh_ZH 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 之前为应付中期检查简单接入了一个基础服务,并未对 prompt 词等做太深入的细分,为了实现更人性化的效果,我对大模型的服务进行了更进一步的完善 首先是前端的效果: 超级用户端: 一般用户端: 三个按钮分别对应 AI 整理格式,AI 基础纠错,AI 结合题目和代码详细检查错误。 前两者的返回值是代码 阅读全文
posted @ 2024-06-23 17:07 wh_ZH 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 这一篇算是补上的,因为这时微调已经做完了,稍微记录一下这个过程中的工作 算了不写了,具体参见队友的博客 https://www.cnblogs.com/asuldb/p/18235969 https://www.cnblogs.com/asuldb/p/18249628 阅读全文
posted @ 2024-06-23 17:07 wh_ZH 阅读(8) 评论(0) 推荐(0) 编辑
摘要: 明天中期检查,紧急把半成品大模型拉来用了。 租的卡没有公网 IP,用 ssh 的端口映射配了很久,来不及写了,回头补上 交了个不带并查集路径压缩的 kruskal 求最小生成树 大模型给出的答复如下,耗时十几秒: 阅读全文
posted @ 2024-06-23 16:52 wh_ZH 阅读(4) 评论(0) 推荐(0) 编辑
摘要: CodeGeeX 的配置 https://modelscope.cn/models/codefuse-ai/CodeFuse-CodeGeeX2-6B 魔塔社区找到 CodeGeeX,绑定阿里云账户,申请免费实例资源 clone 项目 直接安装 requirements.txt,发现出现了版本问题, 阅读全文
posted @ 2024-06-23 16:48 wh_ZH 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 沙箱 评测沙箱(Sandbox)的基本原理是通过隔离和控制程序运行环境来确保系统的安全性和稳定性。具体来说,评测沙箱的基本原理包括以下几个方面: 隔离:沙箱会在一个独立的环境中运行待评测的程序,确保该程序无法直接影响到主操作系统或其他应用程序。这通常通过虚拟化技术或容器技术来实现。 权限控制:沙箱会 阅读全文
posted @ 2024-05-31 11:17 wh_ZH 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 源码分析 代码分析 data 是存储测试数据和配置文件的目录,其中包含解压后的文件和压缩包(作为备份) include 是测试相关的工具方法, result 暂存评测结果 work 正在评测的题目包含的数据,每当有评测请求时,将所有测试数据拷贝到对应文件目录中 当有评测任务来到时,补全地址,使用系统 阅读全文
posted @ 2024-05-31 11:15 wh_ZH 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 题面使用 Markdown 编写。 理论上,题面是可以自由编写的,但还是有一些推荐的格式和规则: 中文与英文、数字之间加一个空格隔开。 输入输出样例视为代码块,使用Markdown的 ``` 语法。 题面中最高级标题为三级标题。 一切数字、数学符号、运算符、变量名、公式应当用 LaTeX 语法编写。 阅读全文
posted @ 2024-05-31 11:14 wh_ZH 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 提交的代码会被随机存储到一个文件夹下, 文件名也是随机的 这样做的好处是,首先数据库中只要存储文件名即可,其次多份代码几乎不可能产生重复,并且尽管事务不是原子的,碰撞概率也是相当低的 以上是上传和存储的过程 阅读全文
posted @ 2024-05-31 11:14 wh_ZH 阅读(4) 评论(0) 推荐(0) 编辑
摘要: Universal OnlineJudge 部署流程 安装 docker curl -fsSL https://get.docker.com -o get-docker.sh sudo sh get-docker.sh sudo systemctl start docker # 启动 docker 阅读全文
posted @ 2024-05-31 11:13 wh_ZH 阅读(5) 评论(0) 推荐(0) 编辑