AI知识分享AI知识分享
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
✿导航
  • 人工智能
  • 神经网络
  • 机器学习
  • 深度学习
  • 强化学习
  • 自然语言处理
  • 计算机视觉
  • 大模型基础
  • 动手学深度学习
  • 理论理解
  • 工程实践
  • 应用开发
  • AI For Everyone
  • AIGC_2024大会
  • AIGC_2025大会
  • Transformer
  • Pytorch
  • HuggingFace
  • 蒸馏
  • RAG
  • 目标检测
  • MCP
  • 概念
  • 意图识别
  • 工具
  • 意图识别

    • 应用 - 意图识别
  • 工具

    • 工具 - AI代码生成率检测工具
    • 工具 - 契约测试

AI代码生成率检测工具

  • 数据获取
  • 数据处理
    • 任务1: 过滤所需要的初始数据
    • 任务2 输出计算的最后数据
  • 实现过程

提示

思路:根据输入的excel文件,按照筛选条件过滤期望的初始数据;将该数据进一步处理获取最终的表格结构,同时计算AI代码生成类型信息和生成率。———— 利用大模型工具,一步步实现该需求,得到最终可执行的脚本。

示例:

根据原始数据里面关注的信息列

详情

输出最终满足要求的输出结构,主要标注出代码的类型和ai生成率

详情

具体实现细节

数据获取

  • 获取原始excel文件:总AI代码单数.xlsx ———— 扩展思考:原始输入的源可以不同,例如网站、文件,图片等,通过归一化处理,给大模型可以解析的格式即可

数据处理

下面是如何一步步利用通义千问大模型,得到需要的脚本。

第一步:描述需求,以markdonw格式,给出详细的指令:

任务1: 过滤所需要的初始数据

  • 根据输入的 总AI代码单数.xlsx,进行提取
  • 过滤条件 列名 = [行政团队, 提交人姓名工号, 代码提交id, 文件路径, 代码提交链接, AI数据标注行数, 一次提交新增代码总行数]
  • 过滤条件 行政团队 == 开发团队
  • 任务描述:给出对应的python实现代码, 输出结果excel名称为 过滤后的AI代码单数.xlsx

实现过程

将 总AI代码单数.xlsx 和 上述提示词给通义千问 大模型,输出Python代码,如filter_data.py实际运行代码:

  • 2.1 windows机器安装依赖
    • pip3.exe install pandas openpyxl
  • 2.2 执行脚本
    • python .\filter_data.py

得到输出结果 过滤后的AI代码单数.xlsx

PS D:\code\klc\share4ai\docs\zh\framework\ai_code_excel_deal> python.exe .\filter_data..py
数据已成功过滤并保存到 过滤后的AI代码单数.xlsx

任务2 输出计算的最后数据

  • 根据输入的 过滤后的AI代码单数.xlsx ,进行处理
  • 保证原始 过滤后的AI代码单数.xlsx 不变,输出新的excel结果
  • 将 行政团队 列名修改为 团队
  • 将 提交人姓名工号 列名修改为 提交人
  • 将 代码提交id 列名修改为 Commit ID
  • 将 一次提交新增代码总行数 列名修改为 Add Lines
  • 新增一列 AI Detail,如果过滤后的AI代码单数.xlsx里文件路径列名所在列的内容包含 /ft 且包含 _test.go,则新增内容FT 代码生成: aicode ailine,ai_line, ail​ine,ai_line/addline,否则填写为Product代码生成:aicodeadd_line,否则填写为Product代码生成: aicode addl​ine,否则填写为Product代码生成:aicodeai_line, ailine/ai_line/ail​ine/add_line,
    • 其中 ai_line和add_line是变量, 分别对应AI数据标注行数和一次提交新增代码总行数
    • 即上述文本里出现的 ailine,ai_line, ail​ine,ai_line/$add_line, 需要是实际的数值计算结果
  • 任务描述:给出对应的python实现代码, 输出结果excel名称为 AI计算结果.xlsx,且仅包含[团队, 提交人, Commit ID, AI Detail, Add Lines]列的内容

实现过程

将 过滤后的AI代码单数.xlsx和 上述提示词给通义千问 大模型,输出Python代码,如calc_res.py实际运行代码:

  • 执行脚本 python .\calc_res.py

得到输出结果 AI计算中间结果.xlsx 和 AI计算结果.xlsx

PS D:\code\klc\share4ai\docs\zh\framework\ai_code_excel_deal> python.exe .\calc_res.py    
数据已成功处理并保存到 AI计算中间结果.xlsx
数据已成功处理并保存到 AI计算结果.xlsx
最近更新: 2025/3/22 09:49
Contributors: klc407073648
Next
工具 - 契约测试