根据 SWE-Bench 的数据,Genie 是世界上最强大的软件工程模型,是 Cosine 在人工智能驱动开发方面的最新创新。它旨在模拟人类工程师的认知过程,使其能够以前所未有的准确性和效率解决复杂问题。
喜好儿网
Genie 是世界上第一位接受过数据培训的人工智能软件工程同事,完美模拟了人类工程师的认知过程、逻辑和工作流程。他们的专有技术生成的数据代表完美的信息谱系、增量知识发现和逐步决策。这使得 Genie 能够突破其他人工智能软件工具所面临的限制,这些软件工具是通过一些附加工具(例如网络浏览器或代码解释器)对基础模型进行包装的。 Genie 能够解决看不见的问题,以与人类工程师相同的逻辑方式迭代和测试其输出。
根据 SWE-Bench 的数据,外包美工Genie 是世界上最强大的软件工程人工智能,他们的得分为 30.07%,这是评估人工智能模型中软件工程技能的行业标准。这比亚马逊 Q 和 Code Factory 保持的 19% 之前的最佳分数提高了 57%(就上下文而言,OpenAI 的 GPT4 分数为 1.31%)。这标志着迄今为止所有公司取得的最高分数,也是该基准历史上 SOTA 分数最大的单次增幅。作为最新版本的一部分,他们观察到 Genie 增强的推理和规划能力可以很好地推广到软件工程领域之外,并致力于严格而仔细的红队工作。