<div class="w-full text-token-text-primary" dir="auto" data-testid="conversation-turn-11" data-scroll-anchor="false"> <div class="py-2 juice:py-[18px] px-3 text-base md:px-4 m-auto md:px-5 lg:px-1 xl:px-5"> <div class="mx-auto flex flex-1 gap-3 text-base juice:gap-4 juice:md:gap-5 juice:lg:gap-6 md:max-w-3xl lg:max-w-[40rem] xl:max-w-[48rem]"> <div class="group/conversation-turn relative flex w-full min-w-0 flex-col agent-turn"> <div class="flex-col gap-1 md:gap-3"> <div class="flex flex-grow flex-col max-w-full"> <div class="min-h-[20px] text-message flex flex-col items-start whitespace-pre-wrap break-words [.text-message+&]:mt-5 juice:w-full juice:items-end overflow-x-auto gap-2" dir="auto" data-message-author-role="assistant" data-message-id="59c5498f-236e-4296-b94b-51c3eda7cedd"> <div class="flex w-full flex-col gap-1 juice:empty:hidden juice:first:pt-[3px]"> <div class="markdown prose w-full break-words dark:prose-invert light"> Retool 刚刚发布了最新2024上半年《人工智能现状报告》,收集了约750名技术人员的意见,包括开发者、数据团队和各行业的领导者,了解如何利用人工智能产生真正的影响。 <h3>主要发现</h3> <h5>AI情绪变化</h5> <ul> <li>在2023年的报告中,大多数受访者对AI持谨慎态度,认为其略微被高估。2024年,这种情绪并没有显著变化,各个角色的平均评分仍在5分左右(“合理评价”到“略高估”)。</li> <li>受访者认为,虽然AI有巨大的潜力,但目前仍处于相对不成熟阶段,很多应用没有真正发挥其价值。</li> </ul> <h5>AI应用现状</h5> <ul> <li>大部分受访者表示,他们的公司还未达到AI应用的最高水平。仅有约30%的受访者认为他们的公司在AI应用方面处于“运行”或“飞行”阶段。</li> <li>在不同的行业中,咨询(46%)、房地产(46%)和消费品(37%)领域的AI应用程度最高。</li> <li>非营利组织和材料行业的受访者表示,他们在AI应用方面落后。</li> </ul> <h5>投资和生产力</h5> <ul> <li>绝大多数受访者每周至少使用一次AI工具,56.4%的人几乎每天使用。小公司(1-9名员工)和较大公司(1000-4999名员工)的每日使用率分别为72%和43%。</li> <li>在不同角色中,产品和工程部门的日常使用率最高,分别为68%和62.6%,设计部门最低,为39%。</li> <li>经常使用AI工具的受访者报告生产力显著提高,64.4%的日常用户报告生产力显著提高,而每周用户和偶尔用户的比例分别为17%和6.6%。</li> </ul> <h5>隐秘使用</h5> <ul> <li>相较于2023年,允许在工作中使用AI的公司比例增加,从54%上升到64.2%。然而,仍有27.3%的受访者在公司政策不明确或不允许的情况下秘密使用AI。</li> <li>只有约9%的受访者在违反公司政策的情况下秘密使用AI,其他人的动机主要是内部对齐和对使用AI的看法不一。</li> </ul> <h5>替代风险</h5> <ul> <li>45.7%的受访者认为初级员工最有可能被AI替代。中层管理人员(13.2%)次之,而高级IC和高管的替代风险较低。</li> <li>高层管理人员(如C-suite)是AI工具生产力提升,这表明AI被视为一种工具,而非威胁。</li> </ul> <h3>AI技术和工具</h3> <h5>模型使用</h5> <ul> <li>OpenAI的模型(如GPT-4和GPT-3.5)在生产中最常用,占据约76.7%的市场份额。其中,GPT-4的使用率最高,为45%,其次是GPT-3.5,占25%。</li> <li>Anthropic的Claude 3模型在本次调查中表现突出,其使用率相比之前大幅提升。Mistral也出现在使用名单中。</li> </ul> <h5>工具和数据库</h5> <ul> <li>使用向量数据库(如MongoDB和Chroma)进行模型定制的公司数量大幅增加,63.6%的受访者表示使用了向量数据库。</li> <li>公司越大,使用向量数据库或RAG(检索增强生成)的可能性越高。5000人以上的公司中,33%的公司使用这些工具。</li> <li>最受欢迎的向量数据库是MongoDB,满意度最高。Chroma紧随其后,用户满意度也很高。</li> </ul> <h5>硬件资源</h5> <ul> <li>只有13.2%的公司拥有或操作自己的GPU,大多数公司租用云提供商(如Amazon Sagemaker和Databricks)的GPU资源。Databricks在用户满意度方面表现最好。</li> <li>投资GPU的公司中,53.7%表示这种投资带来了正向的ROI(投资回报),尤其是在5000人以上的大公司中,40%的公司报告了积极的ROI。</li> </ul> <h5>AI开发工具</h5> <ul> <li>59.1%的公司使用某种形式的AI开发工具,无论是自制的还是商用的。最常用的单一工具是HuggingFace,占15.8%,并且用户满意度最高。</li> <li>多工具组合中,LangChain(21.3%)和HuggingFace(20.1%)是最常用的工具。</li> <li>40.9%的受访者没有使用额外的AI开发工具,这表明该领域仍有很大的发展空间。</li> </ul> <h3>挑战与前景</h3> <h5>主要障碍</h5> <ul> <li>开发AI应用的主要障碍包括数据安全、资源不足和组织挑战(如获取高层支持)。这些障碍与AI技术本身无关,而是与企业环境和资源管理有关。</li> <li>38.9%的受访者提到模型输出的准确性和“幻觉”是主要问题,33.5%的受访者提到了数据访问和安全问题。</li> </ul> <h5>满意度</h5> <ul> <li>总体上,受访者对AI技术栈的满意度较高,超过72%的受访者知道需要改进的地方,并愿意进行调整。最满意的行业包括医疗保健(45%)、教育(43%)、咨询(42%)和非营利组织(40%)。</li> </ul> <h5>未来展望</h5> <ul> <li>大多数受访者认为,未来十年内实现通用人工智能(AGI)的可能性很高,59.9%的人认为这一概率很高或非常高,2.7%的人认为AGI已经存在。</li> </ul> <h5>以下是详细报告翻译</h5> <hr /> </div> </div> </div> </div> <div class="mt-1 flex gap-3 empty:hidden juice:-ml-3"> <div class="items-center justify-start rounded-xl p-1 z-10 -mt-1 bg-token-main-surface-primary md:absolute md:border md:border-token-border-light flex"> <h3 class="headline-xl md:headline-display-md my-4 text-pretty max-w-[15em] text-surface-text-base" data-immersive-translate-walked="1153043c-2652-45ed-97b3-2cfa973203e3" data-immersive-translate-paragraph="1"><span class="notranslate immersive-translate-target-wrapper" lang="zh-CN" data-immersive-translate-translation-element-mark="1"><span class="notranslate immersive-translate-target-translation-pre-whitespace immersive-translate-target-translation-theme-none immersive-translate-target-translation-block-wrapper-theme-none immersive-translate-target-translation-block-wrapper" data-immersive-translate-translation-element-mark="1"><span class="notranslate immersive-translate-target-inner immersive-translate-target-translation-theme-none-inner" data-immersive-translate-translation-element-mark="1">2024上半年《人工智能现状报告》</span></span></span></h3> AI行业正在迅速发展,技术也在不断增多,伴随着这些活动而来的还有炒作、怀疑、焦虑和好奇。我们对AI采取实用的态度,因此回顾了解开发人员如何使用AI构建项目以及什么对企业真正有用。 我们是否正在摆脱演示软件和商品化模型,转向实际应用和真正的投资回报率?在这个聊天机器人的时代,我们是否正在繁荣?普通的AI技术堆栈到底有多实用? 我们询问了约750名技术人员,包括开发人员、数据团队、领导层和其他技术角色和行业的人士,来分享他们的看法。让我们来看一下。 <strong><em>对AI情绪的最新观察</em></strong> 在我们2023年的报告中,受访者对AI持谨慎态度,大多数人认为AI有些被高估了。到2024年,这种看法没有太大变化: <img class="aligncenter" src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Ff80a199b5f78bf3e749f2579966366d4c785dfc4-1920x1140.png&w=3840&q=75" alt="" /> 即使按角色分解情绪也是如此,所有级别的评分平均在5分(“合理评价”到稍微“高估”)之间。经过2023年的炒作风暴(可以说,这使得任何AI都难以满足期望),人们对AI的相对不成熟、当前的局限性和巨大潜力有了更清晰的认识。 在书面回应中,我们看到了AI潜力被炒作暂时掩盖的感觉: <ul> <li>AI被硬塞进产品中,但并没有真正增加价值。(有人想起了“我们用$HOTLANG重写了一切”吗?)</li> <li>“AI”被用作机器学习、大语言模型(LLM)和自动化的统称。</li> <li>AI被视为魔法锤,即使在传统编程足够或优于AI的情况下也使用,而不必面对繁琐的提示和幻觉。</li> </ul> 似乎仍有大量无用的应用需要筛选,以发现对日常技术和商业应用真正有用的AI,但受访者对AI的实用性和应用范围将会出现持乐观态度。 <strong>一句话(或几句话):就可操作的AI而言,这只是个开始。</strong> 虽然媒体关于AI的主流叙述是其采用和实用性正在飙升,并且它正在接管世界,但现实是,至少目前,还比较温和。 <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F4bb206fe6a9451f761919c1b7dc8cdc6954ac064-1920x1086.png&w=3840&q=75" alt="" /> 也许每个人都在使用它,但大多数受访者清楚地表明,他们离顶峰还有很长的路要走。大约30%的受访者认为他们的公司在采用AI方面表现良好,其中咨询(46%)、房地产(46%)和消费品行业(37%)排名最高。但总体而言,自认为领先(即飞行)的比例从2023年的13.4%下降到2024年的9.8%。 材料行业的100%受访者报告在这一领域的成熟度滞后(虽然样本量相对较低);80%的非营利组织受访者表示同样的情况。 此外,受访者表明的进展大多不是_变革性的_(与报告中的例外情况相比,至少目前还不是),这些用例的影响平均得分为6.7分(满分10分)。随着我们对采用障碍和挑战有了更清晰的认识,现实检查开始了。 在所有角色、团队和级别中,只有少数(4.5%)受访者认为他们的公司在AI方面投入过多,而“恰到好处”(42%)和“不足”(40.5%)之间的分布相对均匀。 更深入地看,直接管理者——主管、经理和副总裁——比IC更希望看到投资。 <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Ff37ab7b87e67e84b11aabcc7777c21bc61ccfb85-1920x1085.png&w=3840&q=75" alt="" /> 按公司规模划分,员工人数在50-99之间的公司最倾向于更多地采用AI(50%),其次是超过5000人的企业(45%)。其他规模的公司范围从33%到42%不等,没有线性关系。技术团队中,IT工作人员最看好对AI的更多投资(49%)。我们的设计团队朋友则不太确定(33%)。 几乎四分之三的受访者在工作中至少每周使用副驾驶和其他AI工具(如ChatGPT,Claude等),其中56.4%接近每天使用。在最小的公司(1-9名员工)中,这些日常数字飙升到72%,其次是10-49人公司的59%。(虽然其他大多数公司规模在50%左右,但在1000-4999人公司中,这一比例下降到43%。) 按角色划分,产品和工程领域的每日(大致)采用率分别为68%和62.6%,而设计领域则为39%。(我们看好AI的IT朋友则位居中间,为50.1%。) 总体而言,使用副驾驶或其他AI工具工作的受访者中有很大一部分报告生产力有所提高: <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F075d566f64f8a6ca9cf183a3eef99127656b7c26-1920x1130.png&w=3840&q=75" alt="" /> 事实也表明,你使用AI工具越多,越有可能觉得它们有价值:64.4%的每日用户报告显著提高了生产力,而每周用户为17%,偶尔使用者为6.6%。(公平吗?) <a href="https://retool.com/reports/state-of-ai-2023" target="_new" rel="noreferrer noopener">上次</a>,我们问了一个_有点奇怪_的问题:<strong>你是否在偷偷使用AI工作?</strong> 结果相当多的人在偷偷使用(34.4%)。这次,我们想看看这个趋势,并更好地理解发生了什么。让我们来分解一下。 <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Fcc544d9567a80acbdfae056453adf2c0c32b1eba-1920x1130.png&w=3840&q=75" alt="" /> 今天允许在工作中使用AI的受访者比例比约6个月前要高(64.2%对54%),但仍有超过四分之一(27.3%)的受访者在工作中偷偷使用AI。虽然比2023年有所下降,但鉴于整个企业堆栈中现在可用的AI功能的增加,有些令人惊讶。那么,为什么要偷偷摸摸地使用它呢? <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Facc5aba1fe052d220d8eb55c9f90aef6e5806a48-1920x1652.png&w=3840&q=75" alt="" /> 大约9%偷偷使用AI的人是直接违反公司政策的——其他动机与内部一致性和对使用AI的看法或政策不清晰有关。自去年以来,对在工作中使用AI的总体兴趣有所增加(即使是相对无害的用例,如总结会议记录),加上监管未能跟上采用的步伐,可能导致了一个有点模糊的环境...... (在这一点上,62.9%的受访者至少在一定程度上关注新兴的AI法规和政策。) 如果你最近上网,你可能会说关于谁的工作可能会因为AI而消失的讨论很_热_。随着“日常AI”成熟为真正的用例和投资回报率,我们是否真的应该担心人类与机器之间的竞争?软件工程会变得过时吗? 我们的受访者有一些想法。虽然15.3%的受访者认为没有人真正面临被AI取代的风险(新技术=更多需求=更多需要工程资源,我们说对了吗?),但45.7%认为初级IC最有可能被AI取代。在书面回应中,事情变得更微妙——变化是合理的预期。毕竟,如果初级IC被取代,当世界仍然需要比它能构建的更多的软件时,中高级IC会从哪里来呢?🤔 中层管理人员排名第二(13.2%),但在那些中层管理人员主要是监督而非战略的公司,容易想象这些功能在某种程度上被自动化。(另一方面,通过自动化节省时间可能使这些中层管理人员更具战略性...!) 高级IC和执行/高级领导层被认为风险较低。 与此相关(或不相关)的是,执行官们在采用AI方面的热情一直很高:C-suite受访者是最大的每日AI用户,约72%(其他角色范围为约45-56%)。与其他角色相比,他们还报告了最高的影响力和生产力提升,增加了AI是工具而不是威胁的想法。(我们的2023年报告发现,C-suite和副总裁对AI改变其角色的预期最大,因此投资于AI技能提升是符合逻辑的。) <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Fc1e8ae7512446025fc3b5cc8549393b1eb80f653-1920x1206.png&w=3840&q=75" alt="" /> 也许这一切都表明了一个机会:使用AI作为杠杆可以帮助领导者和IC为自己创造一个护城河。竞争可能不是人类与AI之间,而是人类与使用AI的人类之间。(许多书面回应支持这一概念!) <strong><em>真正的AI用例和投资回报率</em></strong> 你会得到一个AI驱动的聊天机器人,你也会得到一个AI驱动的聊天机器人...... 超过一半的受访者(55.1%)已经构建了一个AI驱动的聊天机器人,或他们的公司已经构建了一个。(16.8%构建了三个或更多。) 尽管(或因为)它们的普及,受访者对这些新“AI”功能或产品仅限于聊天机器人的疲劳有些抱怨。虽然从经验来看,聊天机器人似乎主导了面向公众的AI应用(包括Klarna大肆宣传推出的RAG增强支持机器人),这些应用可能是最显眼的,因为它们数量众多,并且目前它们是易于实现的用例。我们会很有兴趣观察这一发展,看看光环或疲劳是否会消退。 <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Fbb4223f923fbdc72957fe2ae19944d365ff0cb43-1920x1129.png&w=3840&q=75" alt="" /> 支持聊天机器人,通常是一个“首选”用例和示例,是受访者第三大最受欢迎的内部实时用例,写代码或查询排在首位(42.1%),其次是知识库问答(36.4%)。内容生成用例有些混杂。 <ul> <li>顺便说一下,我们保持传统,这份报告中的内容不是由AI生成的。</li> </ul> <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Ffdfb7da64b7afbec9bac918ddee96b10ddcb9fde-1920x3171.png&w=3840&q=75" alt="" /> 虽然大多数用例与我们在2023年末的上次调查相差几个百分点,但有些领域约有5个点的变化,这是我们将继续关注的趋势: <ul> <li>写代码或查询从47.5%下降到42.1%,减少了5.4个百分点,撰写文案从32.9%下降到28%。</li> <li>支持聊天机器人从28.9%上升到33.9%,增加了5个百分点。</li> <li>自动化工作流程从12.9%上升到17.8%,增加了近5个百分点。</li> </ul> 我们还看到AI在各部门中的使用分布多样化。 <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F353de5994530ef9f9e184492baeb212a366c0fdd-1920x950.png&w=3840&q=75" alt="" /> 乍一看,支持部门在采用方面落后于其他部门(在工程、营销、数据科学、产品管理和运营之后排名第六)似乎是矛盾的,尤其是支持聊天机器人仍然是第三大内部实时用例。 实际上,支持聊天机器人在使用中和支持团队使用AI驱动应用程序的实际百分比相差只有几个百分点——但在向客户推出AI支持方面可能会有一些犹豫: <ul> <li>受访者在开发AI应用时关联的三大痛点中有两个是模型输出准确性/幻觉(38.9%)和数据访问/安全性(33.5%),这些问题与2023年的调查结果基本相同。</li> <li>对模型输出的信任度在所有角色中大多是低到中等,平均为6.1分(满分10分)(即使受访者总体上喜欢并希望继续使用这些模型!)。</li> </ul> 只有8.5%的受访者对外部用例的AI前景表示强烈看好,而57.9%认为内外部用例前景相同,33.7%认为内部用例前景更好。 <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F2dabb5ab00dc35956c0df4a1ac1964bb50d94f79-1920x1229.png&w=3840&q=75" alt="" /> 这意味着公司可能希望减少风险,先尝试内部AI应用,让团队成员自助支持,然后再向客户暴露这些风险。 因此,我们知道,受访者正在构建的AI应用程序类型以及目标对象——但接下来是什么?还有哪些用例、应用程序、大动作或小事情让他们对构建和使用AI感到兴奋?我们在书面回应中看到了些趋势。 总体而言,受访者热情地使用当前的“AI事物”——辅助生成初稿和提案,分析文本,帮助编写和调试代码——但其他人评论说,当前AI的用途有限。总体来看,人们期望随着技术和我们集体构建能力的成熟,新的和创新的用途将会出现。 <strong><em>看看你猜对了——AI技术堆栈</em></strong> 随着越来越多的开发人员构建更多的AI应用——并探索最有效的方法——我们想了解更多关于他们使用的工具的信息。什么在堆栈中工作得很好,什么没有?有多少模型定制?有人真的知道GPU是否被正确分配了吗?让我们深入研究一下。 OpenAI的模型仍然是生产中最常用的模型,占AI用户模型选择的约四分之三(76.7%)。GPT-4领先,占45%,其次是GPT-3.5,占25%。(我们没有问4o,因为在调查时它刚刚出现,但我们打赌受访者正在尝试它。)这种模式在各个行业和公司规模中也同样适用,OpenAI在各方面都领先。 <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F986faac4ca18610b8d76c6f361d680a76116408d-1920x1800.png&w=3840&q=75" alt="" /> 也就是说,有些有趣的亮点——Anthropic的Claude 3单独的数字比我们上一份报告中的Anthropic多了四倍多。(这还不包括早期的Claude。)Mistral最近筹集了一轮资金,也出现在名单上。 当然,我们听到了一些对各种GPT口味的常见抱怨(“我希望它在不知道某件事时告诉我,而不是提供虚假信息”),但受访者对他们的模型情况感到相当满意。超过三分之一(35.5%)非常或大多数满意;34.5%至少有点满意;11.9%并没有特别的感觉。在那些希望改变AI堆栈某些方面的人中,只有17.1%对他们的模型提供商不满意;12.3%只是希望切换到同一提供商的不同模型。 大多数受访者在某种程度上定制他们的模型,大多数微调现有模型(29.3%)或使用向量数据库或RAG(23.2%)。(在后者方面,超过5000人的公司比平均水平高出约10个百分点,约为33%。) 进入人们如何保持应用程序准确性的细节,团队使用各种方法:用户反馈环路最受欢迎(39.5%),紧随其后的是提示工程迭代(36.4%)和模型监控和评估(35.9%)。 我们还在受访者的书面回应中听到了对模型偏见和公平性的普遍关注,这些关注并非毫无根据:近30%的受访者报告说他们要么不关心要么不知道如何解决模型中的偏见和公平性问题。(另有25.9%表示他们目前没有解决这个问题,但希望这样做。)这里有层次:一些公司可能期望基础模型已经内置了偏见校正,一些偏见问题可能对他们使用AI的输入和任务不适用(例如,编写单元测试与营销文案),然后……有些人真的不关心。😩 在那些_正在_解决偏见和公平性问题的人中,最受欢迎的方法是定期审计和评审(30.4%),预处理技术如数据增强和偏见校正(23.8%)以及后处理公平调整(17.8%)。 进一步挖掘,17.7%的调查受访者所在的公司正在构建自己的模型。值得注意的是,金融服务公司落后,仅为11%。一些公司可能会受益于定制大语言模型,通过提供高级数据安全性、适应市场变化和定制服务和工具,但考虑到训练模型的高初始成本和持续维护费用,看到这么多公司走这条路可能会让人惊讶。 也就是说,这里有一些相当清晰的界限: <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F8ca0fa3438db367081b2c9f571850438c268ce83-1920x1230.png&w=3840&q=75" alt="" /> 今天,大多数受访者报告使用向量数据库(63.6%)——从2023年的20%大幅跃升。(使用向量数据库的人越多,他们越推荐它。是先有鸡还是先有蛋数据库?) 更进一步,那些在最大公司工作的受访者最有可能使用向量数据库或RAG来定制他们的模型。(超过5000人的公司为33%。) <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F8cd0314ec6d83b9f895f5a604021073046b8c826-1920x1777.png&w=3840&q=75" alt="" /> 使用向量数据库确实可以引入更多的“调整旋钮”来配置检索块长度、如何将数据馈送给模型等——因此值得一提的是那些定期用户特别满意的人。MongoDB保持了我们在<a href="https://retool.com/reports/state-of-ai-2023" target="_new" rel="noreferrer noopener">去年报告</a>中看到的强劲表现,定期用户满意度最高,按NPS衡量。Chroma攀升至NPS排行榜,紧随MongoDB之后。(额外表扬Qdrant——虽然样本量较小,但他们的用户同样满意。) <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Fe241cb33712c5e62b93f5ff957fe213ba6c345cd-1920x975.png&w=3840&q=75" alt="" /> 在评估和比较项目的向量数据库时,最受欢迎的方法是使用性能基准(40%),其次是用户评论和社区反馈(39.3%)以及概念验证实验(38%)。 略过一半以上的受访者(51.9%)根本没有使用推理平台,考虑到相关的硬件要求和培训成本,这可能并不令人惊讶。在使用推理平台的人中,Amazon Sagemaker(13%)和Databricks(8.6%)在频繁使用中占据首位,其他平台分布相对均匀。(Databricks在用户满意度方面获得了最高分。) <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Fbc2333147f24ce15ad868c8963814aa6efcd873b-1920x975.png&w=3840&q=75" alt="" /> 大多数公司(59.1%)正在使用_某种_形式的附加工具进行AI开发,无论是自制的还是现成的。(呼?呼!)对于那些报告只使用一个工具的人,HuggingFace领先——15.8%报告使用它(并且,比例上,他们比调查中的任何其他工具、模型、推理平台或数据库更喜欢它)。自定义工具(10.6%)是第二常用的解决方案。(Braintrust在使用频率上处于中间位置,但在满意度上表现强劲。) <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F4913fdc8c679dfaa308f81246f3b00c9acf51d20-1920x975.png&w=3840&q=75" alt="" /> 对于使用多个解决方案的人,LangChain(21.3%)和HuggingFace(20.1%)使用最频繁。略过半数(56%)使用一个框架来构建UI。 请记住,40.9%的受访者没有引入任何附加工具进行AI开发——因此,随着团队构建其AI开发堆栈,格局将发生变化并稳定下来。 由于模型训练和实施成本对许多工程领导者来说是首要考虑因素,我们想知道公司如何处理AI硬件和资源分配。少数公司拥有或操作自己的GPU(13.2%),其余公司分为从主要云提供商租赁(38.9%)和新兴提供商租赁(15.8%)。不到三分之一的人根本不直接使用GPU。 而且,关于GPU的运营成本是否能带来投资回报率,意见不一:略过半数(53.7%)说是,而30.6%说不是或不知道(分别为5.1%和25.5%)——这可能表明衡量投资回报率是一个挑战。 也就是说,GPU投资可能与规模一致:最大的公司(5000+人)最有可能报告GPU使用带来正回报,比例为40%,而最小的公司(1-9人)最不可能达到或超过盈亏平衡,比例为19%。 在评估公司是否正确分配GPU资源时,意见分裂,47.7%说是,52.3%说不是或不知道: <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F28732c0c67cc8a5d59aab97e98bfa9421d01ff66-1920x1129.png&w=3840&q=75" alt="" /> 有趣的是,GPU的感知投资回报率不一定与感知的“正确”分配相关。几乎一半(46.8%)在被问到其公司是否正确分配GPU时回答“不”或“不知道”的受访者仍然报告看到至少一些GPU投资回报率。🤔 感觉公司正确分配GPU的受访者(72.7%)更有可能报告看到其GPU投资的正回报。随着AI堆栈的不断演变,GPU分配的持续重新评估可能会成为计划的一部分。 并不是_所有_都是阳光和玫瑰,但确实有阳光,有玫瑰。 我们问到了开发AI应用的最大痛点: <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F348f5aea92e6913462c029a00efbf25bf7031b82-1920x1215.png&w=3840&q=75" alt="" /> 结合这些痛点,我们看到大多数障碍并不是真正特定于AI技术本身。数据安全性、资源、成本和组织挑战,如获得支持,仍然是最大的障碍——无论是小问题还是绊脚石。 而且,至少目前,受访者在AI堆栈中找到了他们更满意的领域——和有待改进的领域。 总体而言,受访者对他们的堆栈更满意而不是不满意: <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2Fbed6a69a38b5cf74a37b7c31fb2868f13296e9f7-1920x1208.png&w=3840&q=75" alt="" /> 在极端情况下,非常满意的受访者数量(10.2%)是想要_完全_重新开始的受访者数量的两倍以上(4.5%)。 按行业划分,医疗保健(45%)、教育(43%)、咨询(42%)和非营利部门(40%)的受访者最有可能表示对其堆栈非常或大多数满意。(材料行业也排名很高,但样本量显著较小。)能源(15%)和政府(21%)部门大幅落后。按公司规模划分,所有公司都在30-40%之间,没有异常值。 继续前进:大多数人(72.1%)知道他们需要改变什么,有时是多项改变: <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F964841be77d83c8aea3516f9798acb680dc5d7e8-1920x1885.png&w=3840&q=75" alt="" /> 似乎中间堆栈有些工作要做——虽然整体情况看起来不错,但在工具和模型之间切换的灵活性可能使构建AI的团队能够获得他们所寻找的结果(和满意度)。 对于一些关于接下来会发生什么的更多想法,受访者分享了他们的希望、梦想和对AI堆栈如何演变的期望: 显然,在个人层面上,AI对人们的工作方式有意义的影响,无论是IC开发人员、产品团队还是高级领导层。显然,企业仍在摸索如何最大限度地利用不断发展的技术。但有迹象表明,开发人员构建和关注的内容正在成熟和精炼,以及各方对生产中AI角色的思考方式。 综合来看,也许有一个开始的路线图,或者至少一些指示灯,领导层可以帮助开发人员进入下一个章节。开发人员不仅需要更好的AI技术和工具来构建具有真正投资回报率的AI应用——他们还需要高层支持、充足的人员和资金以及健全的数据治理来成功进行AI项目。 这是一个通过示范领导、明确AI期望并确保开发人员拥有构建、迭代和快速学习的正确工具的机会。 最后,让我们来个意外的转折,花一分钟来思考一下。 59.9%的受访者认为未来10年内AGI的可能性很高、非常高或确定。2.7%认为它已经存在。聊天机器人会怎么看_这个?_ <img src="https://retool.com/blog/_next/image?url=https%3A%2F%2Fcdn.sanity.io%2Fimages%2Fbclf52sw%2Fproduction%2F46616966a99d2aef7435a77d990b2db58470989a-1920x1212.png&w=3840&q=75" alt="" /> <em>这份报告中的见解来自2024年4月对730人的公开调查。**前5大行业:**技术(37.3%);咨询/专业服务(9.5%);金融服务(7.8%),媒体/通讯(7.2%),教育(6.6%) || **前5大团队:**工程师(31%),运营(19.5%),产品(15.4%),数据(11%),IT(10.9%) || **前5大角色:**中高级(30.8%),主管/经理(30.1%),C-suite(17.4%),初级(12.4%),VP(6.4%) || **按公司规模划分:**1-99名员工(59.3%),100-999名员工(28.1%),1000+名员工(12.6%)</em> <em>**内容与设计:**John Choura,Rebecca Dodd,Willa Gross,Matthew Isabel,Keanan Koppenhaver,Kelsey McKeon,Nate Medina,Sid Orlando,Justin Pervorse,Mathew Pregasen,Cam Sackett,Chris Sandlin,以及更多。</em> 报告原文:<a href="https://retool.com/blog/state-of-ai-h1-2024" target="_blank" rel="noopener">https://retool.com/blog/state-of-ai-h1-2024</a> </div> </div> </div> </div> </div> </div> </div>