
瑞士初创公司 LogicStar 致力于加入AI代理人领域。这家成立于2024年夏天的初创公司已经获得了300万美元的种子轮融资,旨在为开发者市场提供能够自主维护软件应用程序的工具,而不是更典型的AI代理人用例——即代码共同开发。
LogicStar 首席执行官兼联合创始人鲍里斯·帕斯卡莱夫(Boris Paskalev)表示,该初创公司的AI代理人最终可能会与代码开发代理人合作,例如像认知实验室(Cognition Labs)的德文(Devin)这样的公司,带来业务双赢。
代码保真度对于构建和部署软件的AI代理人来说是一个问题,就像对于人类开发人员一样,而 LogicStar 希望通过自动捕捉和修复部署代码中可能出现的错误,为开发工作提供一些帮助。 牌。
帕斯卡莱夫表示,“即使是目前最好的模型和代理人”,也无法解决他们遇到的大多数bug——因此,团队发现了一家致力于改善这些几率并实现更少繁琐应用程序维护梦想的AI初创公司的机会。
为此,他们正在建立在大型语言模型(LLMs)之上,例如 OpenAI 的 GPT 或甚至中国的 DeepSeek ——采取一个基于模型的方法。这使得 LogicStar 可以利用不同的LLMs,并根据哪个基础模型最适合解决特定的代码问题来最大化其AI代理人的效用。
帕斯卡莱夫坚称,创始团队具有构建一个平台的技术和领域专业知识,该平台可以解决挑战或使大型语言模型独立工作的编程问题。他们还可以指出先前的创业成功:他在2020年9月将他的前一个代码审查初创公司 DeepCode 出售给网络安全巨头 Snyk。
“起初,我们考虑实际上构建一个代码的大型语言模型,”他告诉TechCrunch。“然后我们意识到,那将很快变成一种商品…现在我们正在构建假设所有这些大型语言模型是已经存在的。假设实际上有一些相当不错的[AI]代码代理,我们如何从中提取最大的商业价值?”
他说,这个想法建立在团队对如何分析软件应用程序的理解上。“将这与大型语言模型相结合——然后专注于地面化并验证大型语言模型和AI代理实际建议的内容。”
测试驱动开发
然后,对于每个bug,AI代理人能够确定应用程序的哪些部分受到影响——这使得 LogicStar 能够缩小需要模拟以测试大量潜在修复方案的功能范围。
根据帕斯卡莱夫的说法,这种“最小化执行环境”使得AI代理人能够运行“数千”个测试,以重现bug以识别“失败的测试”,并且——通过这种“测试驱动开发”方法——最终达到能够持续修复错误的目的。
他确认实际的bug修复源自LLMs。但是因为 LogicStar 的平台使得这种“非常快速的执行环境”使得其AI代理人能够以规模工作,从而可以将头绪与无用之物隔离开来,为开发者提供LLMs所能提供的最佳方法的捷径。
“我们看到[LLMs]在快速原型设计,测试事物等方面非常出色,但它绝对不适用于[代码]生产,商业应用。我认为我们还远远没有达到这个目标,而这正是我们的平台提供的,”他辩称。“为了能够从这些模型中提取这些能力,我们实际上可以安全地提取商业价值,并为开发者节省时间,使他们能够真正专注于重要的事情。”
企业将是 LogicStar 的初始目标。其“硅智能体”旨在与企业开发团队一起工作,处理各种应用程序维护任务,并释放工程人才以从事更具创造性和/或挑战性的工作。(或者,至少在LLMs和AI代理变得更加功能强大之前)。
尽管这家初创公司宣传了“完全自主”的应用程序维护能力,帕斯卡莱夫确认,该平台将允许人类开发人员审查(以及以其他方式监督)其AI代理人调用的修复措施。因此,信任必须首先获得。
LogicStar 还处于早期阶段:其技术的Alpha版本正在与一些未披露的公司进行测试,帕斯卡莱夫将他们称为“设计合作伙伴”。目前技术仅支持Python ——但对TypeScript、JavaScript和Java的扩展被标称为“即将推出”。
“这次种子轮融资的主要目标是向我们的设计合作伙伴展示技术在Python方面的可用性,”帕斯卡莱夫补充说。“我们已经在这方面投入了一年时间,还有很多机会可以扩展。这就是为什么我们首先要专注于这一点,展示一个案例中的价值。”
这家初创公司的种子轮由欧洲风险投资公司Northzone领投,来自DeepMind、Fleet、Sequoia Scouts、Snyk和Spotify的天使投资者也加入了轮。.
在一份声明中,Northzone的合伙人米歇尔·科廷(Michiel Kotting)表示:“基于AI的代码生成仍处于早期阶段,但我们已经看到的提高生产力的效果是革命性的。这项技术在简化开发流程、降低成本和加速创新方面的潜力是巨大的,团队的广泛技术专业知识和经过验证的卓越记录使他们能够交付真正有影响力的结果。软件开发的未来正在重塑,LogicStar 将在软件维护方面发挥重要作用。”
LogicStar 正在为希望表示对获得早期访问感兴趣的潜在客户运营等待名单。据我们了解,计划于今年晚些时候推出beta版本。