Devin是什么
Devin是由人工智能初创公司Cognition推出的全球首个全自主的AI软件工程师智能体,具备强大的编程和软件开发能力,能够在多个方面协助或完全独立地完成软件开发任务。在SWE-bench基准测试中,Devin解决实际问题的表现远超如GPT-4和Claude 2等AI模型。
虽然开发公司Cognition成立仅两个月,团队却由拥有丰富AI前沿经验和国际信息学奥林匹克竞赛金牌得主组成,并已获得Founders Fund基金领投的2100万美元A轮融资。
Devin的主要功能
- 自主学习新技术:通过阅读文档和代码,Devin可以学习新的技术,增强技能。
- 端到端构建和部署程序:从前端设计到后端部署,Devin能独立完成整个软件开发流程,包括上线应用程序。
- 自主查找并修复Bug:Devin具备出色的调试能力,可以发现并修复代码中的错误。
- 训练和微调AI模型:除了常规编程任务,Devin还能帮助训练和微调其他AI模型。
- 修复开源库:Devin能够解决开源社区中的已知问题或实现新特性请求。
- 对成熟生产库做贡献:Devin可以为成熟的生产库做出贡献,修复错误或添加功能。
Devin的性能对比
在SWE-bench基准测试中(要求智能体解决在 Django 和 scikit-learn 等开源项目中发现的实际 GitHub 问题),Devin能够正确处理13.86%的问题。这一成绩显著高于1.96%的之前技术水平,展示了Devin在理解和解决实际编程问题方面的巨大优势。
对比其他AI模型,Devin的表现远远超过了GPT-4和Claude 2等这些知名的AI模型,后者在相同测试中的正确率通常较低。
如何使用Devin
目前Devin还在内测中,请访问Cognition的官网查看更多信息,想要抢先体验的用户可填写Devin的内测申请表。
数据统计
相关导航
暂无评论...