AI代码生成率检测工具
提示
思路:根据输入的excel文件,按照筛选条件过滤期望的初始数据;将该数据进一步处理获取最终的表格结构,同时计算AI代码生成类型信息和生成率。———— 利用大模型工具,一步步实现该需求,得到最终可执行的脚本。
示例:
根据原始数据里面关注的信息列
详情

输出最终满足要求的输出结构,主要标注出代码的类型和ai生成率
详情

具体实现细节
数据获取
- 获取原始excel文件:
总AI代码单数.xlsx———— 扩展思考:原始输入的源可以不同,例如网站、文件,图片等,通过归一化处理,给大模型可以解析的格式即可
数据处理
下面是如何一步步利用通义千问大模型,得到需要的脚本。
第一步:描述需求,以markdonw格式,给出详细的指令:
任务1: 过滤所需要的初始数据
- 根据输入的
总AI代码单数.xlsx,进行提取 - 过滤条件 列名 = [行政团队, 提交人姓名工号, 代码提交id, 文件路径, 代码提交链接, AI数据标注行数, 一次提交新增代码总行数]
- 过滤条件
行政团队==开发团队 - 任务描述:给出对应的python实现代码, 输出结果excel名称为
过滤后的AI代码单数.xlsx
实现过程
将 总AI代码单数.xlsx 和 上述提示词给通义千问 大模型,输出Python代码,如filter_data.py实际运行代码:
- 2.1 windows机器安装依赖
- pip3.exe install pandas openpyxl
- 2.2 执行脚本
- python .\filter_data.py
得到输出结果 过滤后的AI代码单数.xlsx
PS D:\code\klc\share4ai\docs\zh\framework\ai_code_excel_deal> python.exe .\filter_data..py
数据已成功过滤并保存到 过滤后的AI代码单数.xlsx
任务2 输出计算的最后数据
- 根据输入的
过滤后的AI代码单数.xlsx,进行处理 - 保证原始
过滤后的AI代码单数.xlsx不变,输出新的excel结果 - 将
行政团队列名修改为团队 - 将
提交人姓名工号列名修改为提交人 - 将
代码提交id列名修改为Commit ID - 将
一次提交新增代码总行数列名修改为Add Lines - 新增一列
AI Detail,如果过滤后的AI代码单数.xlsx里文件路径列名所在列的内容包含 /ft 且包含 _test.go,则新增内容FT 代码生成: aicode ai_line/ai_line, add_line,- 其中 ai_line和add_line是变量, 分别对应
AI数据标注行数和一次提交新增代码总行数 - 即上述文本里出现的 ai_line/$add_line, 需要是实际的数值计算结果
- 其中 ai_line和add_line是变量, 分别对应
- 任务描述:给出对应的python实现代码, 输出结果excel名称为 AI计算结果.xlsx,且仅包含[团队, 提交人, Commit ID, AI Detail, Add Lines]列的内容
实现过程
将 过滤后的AI代码单数.xlsx和 上述提示词给通义千问 大模型,输出Python代码,如calc_res.py实际运行代码:
- 执行脚本
python .\calc_res.py
得到输出结果 AI计算中间结果.xlsx 和 AI计算结果.xlsx
PS D:\code\klc\share4ai\docs\zh\framework\ai_code_excel_deal> python.exe .\calc_res.py
数据已成功处理并保存到 AI计算中间结果.xlsx
数据已成功处理并保存到 AI计算结果.xlsx
