欢迎来到搜虎网

Shawn.ai:开发AI项目的过程中,我的时间80%都花在UI设计上

编辑:搜虎网      来源:搜虎网      模型公司   人工智能   openai

2023-11-13 11:07:05 

这个新的“群体”介于传统机器学习工程师和服务产品的全栈工程师之间。 借助成熟的软件供应链和API生态系统,以及日益开放的模型和开发工具链,AI工程师可以快速构建产品原型。 ,利用现有公司的分销渠道或者社交媒体获取用户反馈和数据,从而进一步迭代模型本身,如下图。

双十一国际化__双11海外

有趣的是,Shawn 10 月份在湾区举办了首届“AI 工程师峰会”。 会上,一位独立开发者表达了一个引起很多人共鸣的事实:

“在开发AI项目的过程中,我80%的时间都花在了UI设计上。”

双十一国际化_双11海外_

人工智能似乎是最简单的部分。 如何把一个花了两个小时构建的demo变成可以在生产环境发布的产品是最困难的事情,而这部分工作量与AI无关。

在湾区期间,我与人工智能工程师进行了交流,他们正在积极将人工智能集成到现有的SaaS产品中。 我确实觉得从原型到内部测试再到邀请种子客户测试的过程是复杂且迭代的。 ,通常比预期要长。

在9月份发表的新文章《生成式AI进入第二阶段》中,红杉美国认为,AI从拿着大模型到寻找“钉子”这个真正的壁垒,已经正式进入“第二幕(Act 2)”。 在“客户中,而不是在数据中”。

这种观点对于新创业者来说有点残酷。 如果大模型无论是企业场景的工作流程还是消费场景都无法突破传统的网络效应,那么大多数初创公司仍然面临着“找钉子”的困境。 状态,并需要快速转型。

在我看来,对于初创公司乃至整个生成式AI时代来说,大家其实还处于第一幕或者第一阶段,并没有进入所谓的“第二幕”。

总体而言,存在以下三个差距:

不久前,ChatGPT集成了PDF Chat功能,网上出现了关于该功能对一系列同类产品影响的有趣讨论。 很多人认为,很多初创公司将因此而消亡,所有类似GPT的“包装/外壳”产品未来都将因ChatGPT自身能力的扩张而受到严重挤压。

双11海外_双十一国际化_

不久之后,PDF.ai创始人Damon Chen发表了自己的看法:

“我不认为ChatGPT会开发很多用户急需的PDF相关的小功能。当然,很多比我们规模小很多或者准备往这个方向走的创业者会退出,如果有VC投资的话初创公司如果继续烧钱可能会倒闭。

但 PDF.ai 一直是自力更生且盈利的。 我们的目标不是成为独角兽。 几百万美元的 ARR 对我们来说已经足够了,我有 1000% 的信心我们能做到。 所以我更加乐观的是我们有能力成为Chat PDF产品中最好的。 ”

更有趣的是,在上周的首届 OpenAI Dev Day 上,Chatbase 创始人 Yasser 和 Damon 公开宣布当天其网站上的注册量激增。 看来这些所谓的“AI壳”产品并没有受到重创。 相反,更多的用户会发现通用GPT和单点工具的区别并选择后者。

_双十一国际化_双11海外

我非常同意Damon的想法,它给了企业家和独立开发者很多启发。

首先,如果你想在假设的场景中验证人工智能的价值,不要害怕首先将其作为“包装器”。 需要快速打造可用的工具化产品并验证市场。

经过半年多的交流,很多试图基于OpenAI的API快速构建一个可用的demo的工程师,大家普遍发现需要从一个看起来像“壳”的demo到外面进行一个跨越世界到一个可用的产品。 有很多障碍,很多实验需要重复。

双11海外__双十一国际化

如上图所示,在AI工程师大会上,对目前迁移学习中Domain adjustment的主流方法进行了讨论。 肯定是RAG(Search Augmentation Generation)是针对各类需要大型模型来获取更多事实信息的应用的工具。 信息的应用是人们非常关注的话题。

因此,即使使用了大模型的API,我们也不能笼统地认为“脱壳”是一个简单的任务。 至少它必须是一个可用的工具,一个可以被数百万用户稳定使用的产品,这比大多数产品没有 0 1 之前做过的人想象要困难得多。

双十一国际化__双11海外

(那些从来没有真正做过产品的人总是说OpenAI杀掉了很多AI壳产品,而那些正在做产品的人却一直在赚钱)

其次,海外创业有一个非常立体的环境。 三维具体表现是:

因此,无需过多担心AI是否会成为现有产品的“功能”,或者是否有机会成为独立的原生产品,因为它很可能针对不同类型的用户和场景而存在。

但这对产品经理和设计师都提出了重要的挑战——如何设计下一代AI原生体验产品。

盲目运行了半年多的AI公司,确实已经开始招聘产品经理了。 比如,今年我了解到增长最快的法律科技公司之一的Harvey.ai不仅获得了OpenAI和红杉美国的投资,而且最近还宣布招聘其第一位员工。 Aatish Nayak 是产品领导者之一。 Nayak 是 Scale.ai 的产品负责人,并在那里工作了 4 年。 他还见证了传统机器学习向生成式人工智能演变的重要里程碑。

同样在几个月前,演示生成工具 Tome 还招聘了第一位 AI 产品经理。 当我在湾区和他沟通时,他刚刚加入。 当时与团队高层讨论的核心就是以对话作为互动的基础。 这种体验是用户最容易接受的吗?

换句话说,作为AI产品经理,巧妙地将“传统”用户旅程与AI原生体验(目前核心是对话引导)结合起来非常重要,包括如何引导用户尽快体验AI 。

一个微妙的发现是,产品不再是人工智能创业之初的必要阵地。 人工智能本身使创始人成为最重要的产品经理。

双十一国际化_双11海外_

根本原因在于,生成式AI给产品设计带来的机会是让所有产品实验都可以实时进行,让用户在无感知的情况下给出反馈,甚至参与后续的迭代,包括产品设计和“产品模型”。

产品模型是所有实验的核心。 它是一个完整的、自我迭代的技术堆栈,需要作为人工智能工程师或创始人来构建。 最终,就像OpenAI联合创始人Andrej Karpathy在他的“软件3.0”理论中提出的:

让产品获得“理解”和“生成”的能力。

无论这个模型是否有自己的大模型,无论领域适应中使用什么方法来获取准确的背景信息,无论用户交互是否通过自然语言对话完成,重要的是它是否可以使用任何现有技术,并设计了一套可以实时生成交互数据并反馈最终效果和体验的模型。

双11海外_双十一国际化_

这里最成功的案例是Github Copilot。 记得在某个播客中,产品前期的负责人曾经说过,最美好的事情就是用户与产品本身实时交互。 交互过程(删除或保留代码)和结果(代码和程序)是模型最直接的反馈。 它甚至不需要用户像ChatGPT那样点击“竖起大拇指”来批准答案,过程代表了一切。 同时,代码也是模型下一步训练的最佳数据。

这是我见过的最完美的产品模型,没有任何“刻意”的设计。

最后,这种新兴产品模式的出现或许能够打破“障碍不是数据,而是客户”的残酷事实,因为企业销售的不再是软件或服务,而是一份“工作”(或者是一个头部) )。

对于传统软件或者现有的SaaS公司来说,今年迄今为止最大的主题是“副驾驶”,包括微软、Adobe等,本质上是将AI“设计”为副驾驶,以优化或增强现有的人类工作流程和效率。

这没有问题,这是所谓的“现有企业”对潜在变革技术的“本能和最佳”反应。 从微软和Adobe的最新财报也可以看出,在“副驾驶”的号召下,他们确实抓住了AI带来的大部分商业价值。

双十一国际化_双11海外_

然而,10%、20%的效率提升或成本降低很难让企业甚至大多数消费者改变现有的习惯。 如果我们能够“理解”任务并最终“生成”所需的“结果”,即工作,我们将获得五倍的收获。 哪怕是十倍的效果,也应该被定义为新兴公司或者新一代产品模式的场景。

这可能意味着某个职位或工作将被人工智能取代,但并不是某个“功能”将被取代。

例如,另一家法律科技公司EvenUp结合AI,开始为原告客户提供人身伤害领域的律师“需求包”。 这项工作原本需要律师整合原告的医疗证明和被告保险公司的纠纷建议。 信件、案件描述等材料,最终输出相关书面材料。 现在这项工作不再需要(或逐渐不需要)律师和助理参与,解放了他们的时间,投入到真正的咨询和审判上。 进行中。

正如Benchmark合伙人Sarah Tavel在个人专栏中所说,检验是否还有其他类似机会的标准是:全球范围内是否已经有该领域专门的外部或外包团队来支持现在可以替代的东西通过生成人工智能。 “诸如会计、建筑测量和评估、呼叫和客户服务中心、技术支持外包等工作都是好主意。

双十一国际化_双11海外_

在今年的YC上,我们还可以看到一大批专注于销售、产品、法务审计、财务会计等特定职能方向的初创公司的出现,他们提供的是一个职位的全生命周期解决方案。

“目前生成式人工智能的最大问题不是找到用例、需求或渠道,而是证明价值。”

这也是第二阶段文章中的一句话。 这个结论太笼统了。 在这几个月在湾区的交流过程中,我也清楚地知道,一些年初积极探索的“在位者”在下半年开始出现。 第一批种子客户反馈积极。

之所以探索时间长于市场或公司自身预期,基本都在上述原因范围之内。

但他们已经站在了“客户”的壁垒上,通常是公司本身首先共同创造客户。 如果自己的员工没有从中感受到“价值”,那么上面提到的第三个问题就无从谈起。 。

双十一国际化_双11海外_

最后,我当然希望看到并坚信的是,无论是“副驾驶”型产品还是完整的“工作”服务,都能在各种场景中找到商业价值。

对于后者,更令我兴奋的是,未来的商业模式和销售方式可能会与过去有所不同。

前者旨在供特定工种或特定职位的员工使用,而后者旨在给“经理”或管理他们的负责人留下深刻印象。 从商业角度来看,这类新兴公司一开始可能要同时在PLG和SLG上起步,这并不是一件坏事。

其次,基于账户订阅的业务模式可能会更快地过渡到与使用或基于件的方法集成。 既然最终交付的是一份文件、一张设计图纸甚至是一次诊断服务,那么就应该按照实际的“生产”数量计费才更符合业务规则。 毕竟,在供给侧,训练和推理的成本都明显降低了。

别忘了,ChatGPT 上线才不到一年,下半年已有数百家初创公司(不包括自举团队和未获得融资的独立开发者)进入市场。

怎么说呢,这是进入“第二阶段”的一大步呢?

最后,让我们回顾一下这个“举世闻名”的OpenAI Dev Day。 记得6月份的时候,Sam Altman在一次活动上亲口说过“插件市场还没有找到PMF”。 在这次会议上,我们看到了这个平台的演变:GPT商店两天内就有了1000多名顾客。 GPT 在商店中发布。

虽然在短时间内,我们无法判断更接近苹果应用商店的业态是否真的会让ChatGPT生态更加繁荣。 推荐机制、开发者利润分享机制、成本等问题都需要不断发现和解决。

这也让我想起了另一个变化。 7月初,OpenAI率先向Plus用户推出了Code Interpreter功能,协助用户分析数据、测试代码、制作图表、解决数学问题等。但8月底,该功能被秘密更名为“高级数据分析”并正式集成到ChatGPT for Enterprise(企业版)中。 其意图是不言而喻的。

Code Interpreter 最初听起来像是一个非常抽象的功能名称,而“高级数据分析”是一个试图提供明确价值的产品,至少对其企业用户来说是这样。

ChatGPT 的每次重大发布都像是《权力的游戏》中的一场“红色婚礼”,恐慌者甚至认为它会杀死 YC 上“整整一代”的初创公司。

但事实上,ChatGPT 的每次重大更新都会说:

我们还在“第一幕”! (作者:我想锅我在GN)

搜虎网转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

发表我的评论 共有条评论
    名字:
全部评论