01.回归认证、回归客户
我们和友商的竞争并不是功能的竞争而是认知的竞争,他们靠客户积累,我们靠技术迭代输出架构认知。
Authing 其实是在赋予身份云行业新的认知,我们在用新的架构、新的方法来告诉他们,这个行业到底该怎么做。所以从战略层面、从整个方向层面,我们是远远超过我们竞争对手的。
为什么我们接下来要回归认证、回归客户?因为我们做了很多的方案、技术架构上的行业创新,这些创新,我们需要落实到更细的细节,就比如说用户的 AD 领域模型是什么样子、我们怎么去映射,这是我们下一步要去做的。
为什么我一直在强调我们要回归认证、回归客户,目的就是在我们创新的架构上、在这个指导行业 know-how 的架构上,去更深层次地和客户进行场景化的贴合,完全就是客户导向,这是我们下一步要做的。然后我也相信,我们在这一步的速度以及质量,会很快地大幅领先我们的竞争对手。
因为我们的底盘基本面比较好,基本面好的时候,上面那些细节它只需要时间。但是你构建这样一个基本盘,你需要的是认知。认知和时间,完全是两码东西,如果没有认知,你花再多的时间也做不出来一个非常好的基本盘。这是 Authing 和友商的差异。
我们公司上半年花这么多的时间、精力和成本,投入这么多的研发,下半年我基本上每天都在喊我们要回归认证、回归客户,目的就是让大家知道,我们现在开始认认真真地去服务客户的细节问题。
02.持续学习与归零心态
回到我们的主题,叫持续学习和归零心态。
我们现在做的这个基本面其实是我们公司最擅长做的,这方面我们都很有经验,但是我们对于客户那边的模型、客户的经验可能并没有那么多,所以我们要学习。学习之前,我们是把系统化的知识放到了行业里面去,现在我们要跟客户学习,把客户的知识放到我们身份自动化平台里,所以要持续学习。
然后在学习的时候,我们要有归零心态,就是忘掉你之前所有的 know-how、所有那些经验,然后重新从零开始。我们用事件驱动的方法,怎么才能把客户的问题解决掉,这是我们要去重新思考的。
然后上个月,我也把早期的那几张纸,放到我办公室后面。还是这几件事,我们坚持做创新研发,然后坚持把创新研发推向市场、去做我们的增长,然后通过推向市场获得更多客户信任。“Develop,Grow,Earn”,这是我们公司的主旋律,产研去做研发,然后市场营销团队去做增长,销售团队和交付团队帮我们将产品交付给客户。
再比如说,左下有“如果有 1 亿的欲望,绝不能只有一天的耐心”。另外一个就是右下的“创新加营销”。上面是我们的主旋律,左右两边是两个三角形的脚。一是耐心,另外一个是创新加营销这两个动作,我认为这是带我们走向下一个里程碑非常重要的几个事情。
你们从那些照片可以看出来,Authing 一步一步地从非常简陋的地方,到现在的办公室,包括我们中间经历的各种各样的事情,我们在中间都付出了巨大的努力、巨大的成本,其实都是很不容易的。大家不要认为所有事情都理所当然。我们现在要学会感谢,感谢客户,感谢同事们,同理,我认为也要感谢这个平台,因为这个平台大家真的很不容易,非常不容易。
接下来,还是讲下我们怎么去落实创新加营销这个事情。关于创新,首先我们产品定位在不同阶段都在创新,我们在每个阶段匹配有对应产品的营销策略和销售方法。在营销层面,我们采用的数字化、可规模化的方式来做这件事。这就是我们在落实创新加营销这四个字——我们不仅现在在落实、每个阶段都在落实。包括我们今年在新的产品层面会有一些更大的营销活动,包括销售买方流程我们在做新的迭代升级,我们客户也从 0 涨到 2000 家。
下面,还是希望大家回到公司的战略执行上——回归认证、回归客户。回归客户就是我刚讲的,在我们基本面之上、在我们平台之上,在我们的认知之上,去补全更多关于身份里面的细节。
持续学习是组织生存的唯一可靠路径
有一句话,叫“持续学习是组织生存唯一的可靠路径”。为什么这句话是正确的?回到我们整个产品的发展,其实我们每一个阶段做的事情都很不一样,不管是产品本身、技术本身还是销售营销,做的方式都不一样。
像我们第一阶段 Authing 1.0 的时候,我们做的技术就非常简单,靠几个 API,对我们来说太熟悉、太简单了。然后第二个阶段,我们做的事情不是靠几个 API 的事情,我们开始做各种各样的安全认证协议,然后去设计我们的组织架构的目录,甚至组织架构之间的关联关系。第三阶段我们开始做事件驱动,开始做 Workflow,我们开始做流程的调度、做事件的调度,然后做很多的 diff 算法。
每个阶段,我们的技术和产品都在升级,将来我们还会有 4.0 阶段,会有更多的东西需要去做。那个时候我们的知识体系又要变得更细。所以持续学习能保证我们的研发团队、产品团队做出来更符合时代趋势的产品;持续学习能够让我们的销售团队更好地理解我们的产品、理解我们的能力,更好地将 Authing 的价值带给我们的客户,让我们的市场团队更多地把我们的产品价值传播出去,传播给客户、传播给市场。所以持续学习是我们生存下去的唯一可靠路径——没有其他捷径,这是唯一路径!
咱们再看 OpenAI,刚才我讲的是 Authing 作为一个组织、作为一个人去学习。OpenAI 的 ChatGPT,它学习了全世界所有的文本,然后他变成了一个比较全职全能的机器人,基本上打破了很多人的认知。机器目前也在学习,那如果作为一个人,你不学习、更容易被淘汰。
这个时代,如何定义和分类人才
其实我把人才分成三种类型,一流人才、二流人才和三流人才。
一流人才完善智能基础理论,创造算法模型和算力工具
我认为在目前这个时代下,一流人才是去创造完善智能基础理论的。他把智能这个事情给理论化、给抽象化出来,并且能够创造基于理论来创造算法、模型、算力、工具。这类人是什么人?就是 MIT 等学校里面的博士,他们发很多论文,这些论文绝对不是水论文,他们是有很多新的算法出来。算法做多了之后其实和工程是一样的,算法也是把不同的算法进行拆分,然后重新组合到一起。这类人我定义为是一流人才,他们都在大学里,在做很深层次的研究。
二流人才创造专业知识和 know-how,并懂得如何使用 AI 和自己的专业领域结合的人
这有两个点,一个点是他能创造专业领域的专业知识。第二点,他还能知道怎么去用 AI 来和自己的领域相结合。比如说,Authing 在身份领域就创造了一个事件驱动的身份云平台,这是我们创造了这个领域的专业知识。然后我们就学习 AD,学习 LDAP,学习模型表示方法,然后和我们的平台做映射......这都是在创造新的专业知识。
然后解决方案架构师把我们的一些管理实践拿出来和客户讨论。我们和客户讨论出来的管理实践,A 客户可以传递给 B 客户,这都是 know-how,我们在做这件事情。但做这件事、会做之后还只是一半而已,后面你怎么样去和 AI 结合?你怎么去做 prompt 工程?然后你了不了解在这个场景下,我该用哪些算法、哪些模型来做这件事情,哪些开源的工具会比较好用一些。
我周三的时候找了一个算法专家,是在做大模型相关。然后还找了个做大模型应用的,我们在讨论如何去落地身份云大模型,目前我们已有了初步的方案,马上就开始动起来。
但我发现,他们在我的定义里也不属于二流人才,更不是一流人才,因为他们没有对 Transformer 本身做出任何改进,他们只知道应该这么用。
然后你问他,基于这个模型我还能再做什么事情?我这个场景能不能基于模型继续往下做?他给不到你任何输入。就像我们以前做工程的时候,会拼接各种交互进来,用来解决眼前的一些问题。但我遇到这些学算法的人,他们不会利用已知的算法来拼接出来更多的模型出来,我认为这就算不上一流人才,可能就是一个二点五流人才。因为他在他自己的领域比较清楚了,科班出身,但是他做跳出自己的框架、跳出格子本身的事情就比较吃力。
那什么是三流人才?
三流人才被一流人才创造的 AI 应用和二流人才创造的专业知识所替代
如果我们的身份大模型已经搞出来了,举个例子,比如我们的预期设想是你对 Authing Copilot 说帮我删除 ID 为 xxx 的用户,然后机器人问你要一个 secret ID 或者 token,经过多轮对话之后来调我们的 API——这是最简单的场景,那这个场景就能代替我们的交付人员。
再举个例子,比如我在 A 部门负责 X 角色,当我转移到 B 部门,能够继承 X 的应用访问和数据访问权限,同时数据资源权限范围能够自动从 A 部门变更为 B 部门。这个逻辑说起来,人理解都很复杂,但我告诉你,这些东西我们可以直接用大模型来替代,所以这个时候我问你, 解决方案架构师怎么办?交付工程师怎么办?这个需求也是客户提出来的,用我们大模型能直接实现,这不是很难。
所以,如果说解决方案架构师无法给予客户贴合客户需求的业务场景最佳实践,那你可能就是一个三流人才。因为客户如果比你还懂他的专业知识,懂一些 know-how,那他直接跟我们 Copilot 说一句话,我们就直接帮他完成了。
这就是三类人才的一个定义,然后我们大概有五种业务方向,那目前我们下一步的计划就是会先把业务方向五(Authing 控制台智能化配置)给实现,然后再做应用方向一,即整个 Workflow 的自然语言化。目前我们在技术方向上已经完全验证过,剩下的就是一些工程化的问题。
一流人才,我认为是很难的,因为你要经过数年、数十年的学习,然后再加 20 年研究才能达到这个程度。但是我们可以努力成为二流人才,就是在自己的领域里面成为专家、懂得如何用 AI,这样就可以保证你不会被这个时代所抛弃。然后我们要谨慎成为被替代的三流人才,这个替代真的很快就会来。4 年之前陆奇博士都没有想到,他都没有把大模型列到他所关注的技术范畴里面去,那 4 年之后会变成什么样,我们是不可预知的,所以现在我们要动起来。
03.All in AI
接下来我们要 All in AI,没得说,我先带着几个团队咱们先 All in AI,然后逐渐地把 Workflow 全部干掉。现在Workflow 相当于相对于 4G,然后 AI 就是 Workflow 的 5G。4G 的时代已经过去了,之后我要把 4G 完全干掉,这是我的目标,只有说能把 Workfow 干掉之后,我们这个东西才是比较成功的。
不要把技术神秘化
接下来我会带着大家一起去做 AI,包括有些产品可能会和大家去试验,然后大家也不要觉得这个技术当中有神秘的东西,其实不神秘,全都是人为干预的结果。所有的技术都是人为干预的结果,都是一个幻象。
给大家举两个例子:
一个例子是说 ChatGPT, 它的算法 token 是一个字一个字生成的。然后你们用 ChatGPT 的时候也可以发现,它在界面上也是一个字一个字生成的。我问你们,你们认为这个东西它在界面上是给你模拟出来的,还是真的就是一个字一个字生成的?
其实这是在界面上模拟出来的,因为一个字一个字生成指的是它算法的内部,但那个东西我们已经略过了。然后 OpenAI 的工程师们为了给你更好的效果,说我在网上给你模拟一个它一个一个生成的概念,这其实是一个幻觉,都是人为主观干预的。
第二个例子就是 ChatGPT 它的数据停留在 2021 年,然后你给他看一些 2022 年之后的链接和新闻,你会发现它能够说出来。它为什么能说出来?因为那个链接里面包含了相关关键词,它能够直接来进行匹配,所以这就是幻觉,全都是人为干预的。它为什么知道?是因为它算过这个东西,它能够在大数据库里面通过这个词找到另外一个词,这也是幻觉。所以不要把东西想象得太神秘,都是背后的人想让你看到什么东西、再给它设计成什么样子,这就是技术本质,全是人为干预的一个结果。我们要干的事情是认真探究、思考、验证它人为干预背后的这个原理,这是 Authing 要干的事情。
持续学习归零,恪守一万小时定律
第二,就是我们要有平常心,归零以前的经验。大家都知道有个“一万小时定律”,我自己算了一下,我自己写代码的时间可能就超过 2 万个小时,就不算我大学之前了,算我 18 岁之后,2014 到 2020 这六年时间,每天我写十几小时,总计超过两万多个小时,所以郑凌经常说我很有经验、经常说些新的东西,那是因为我干这东西干了很长时间。刚才我讲一流人才、二流人才、三流人才,说真的很难成为一流人才,那都是凤毛麟角的人,但是我们可以成为二流人才。怎么去成为二流人才?我认为除了花时间,花精力,真正投入一万小时,没有其他任何的方法。
现在我们公司应该还有 20 岁出头的人。给你算一笔账,假如说你现在 20 岁,每天工作完成之后,你每天两个小时,五天就 10 个小时,然后周末每天花 5 个小时,一周 30 个小时,然后你要 6 年时间就会达成一万小时定律。比如你 26 岁的时候,你就可以变成一个非常专家级的人,你可能可以像我一样去设计所有这些产品,没有问题。如果你现在是 22 岁或者 25 岁,你 30 岁的时候也可以成为这样的人,所以我们就是要持续学习和归零。
我现在的心态就是把我之前学的所有东西全部忘掉,我相信那东西对我还有帮助,但是我会全部忘掉,然后重新学习大模型时代,到底该怎么去做编程、怎么去做工程化、怎么去做系统、怎么去做 prompt engineer......这是我现在思考的,要把过去的知识全部忘掉,我要重新建立起我的第二个一万小时。那你们的第二个或者第一个一万小时在哪里?这是我希望各位去思考的一件事情,这也是我们今天来讲持续学习和归零心态非常重要的核心方法,就是投入一万小时。你愿不愿意在你的行业投入一万个小时?
我认为年龄再大都不是问题。因为你看美国那些创造出来 Transformer 架构的这批人,他们都是 50 岁左右,甚至 60、70 了。周末开的智源大会,演讲者 70 多岁,人家依然在搞这些东西,所以多大年龄都不晚。当然越年轻越好,但是只要你的思维永远在线,万事皆有可能。
我觉得我们现在既然没有人去选择去读博,那我们就努力往二流人才靠近,如果你成为二流人才之后,咱们可以再努力靠近一流人才,我觉得这都没问题。
然后给大家看这句话激励下大家:“人生有两种境界,一种是痛而不言,一种笑而不语”。比如为什么这些架构我都能设计出来,然后跟你们一起讨论,是因为我真的做了很多痛而不言的事情,你们没有看到我写代码的时候坐 10 个小时;没有看到我跟产品经理对峙的时候,产品经理给我提了一堆 bug,我在改的时候是什么样子;没有看到我们一行行代码敲的时候是什么样子。这都是痛而不言的事情。所以你想如果你想变得优秀、变得成功、变得能够去带领一个团队去做出一件事情,那一定会有这种痛而不言、笑而不语的东西。
在这个新的时代里面,我们要突破自己、突破公司、突破组织的一个上限,那就是持续学习和归零心态。如果你之前有过这样痛苦的经历,那就重复它;如果没有,那你现在就该开始痛苦起来了。
把算法带给普罗大众,得看工程
最后说下算法,一流人才搞的全是算法,他把算法玩到极致了,算法里面一个是数学,一个是工程。我理解计算机里的算法,就是数学工程、就是怎么把数学的那些特性,通过各种各样巧妙的组合,把它组合成一个能够让计算机执行的算法程序。这是我认为的一个算法,它是重要的,但是也是不重要的。
给大家举个例子,这张图一共是 10 万行的字符集,大家知道这个字符集用来干嘛的吗?这个字符集是 OpenAI 把全人类所有的语言、所有的文字压缩之后,形成的一个文本,他对每一个字符都做了标记,一共就 100255 个字。这是全人类所有的字符,从古至今的所有互联网出现过的字符都在这里,一共 10 万条。
压缩这个算法叫做 BPE,举个例子,比如现在有串字符 aabbccdd,然后我把 aa 变成大写的 Z,bb 变成大写的 Y,就是非常强制的对应关系,然后通过循环把它搞出来。就这样一个算法可以做到无损压缩,很简单。但是如果说,我要把算法变成这东西,请问我得做什么事情把这个简单算法变成整个这一串可以用于生产的东西?
首先,我做的第一件事情是写个爬虫,把全网所有资料先爬出来,那这就是一个浩瀚的工程,这是一个工程问题。那第二步,我要对所有数据做一个清洗,我看了数据什么样子,我就知道怎么做清洗。那第三步,整个互联网数据浩如烟海,可能是几百 T 的数据,我怎么去做?这也是工程问题。然后最后才能变成这个样子。
BPE 这个算法很多博士、很多硕士都知道,但是只有 OpenAI 把它做出来,把这算法用了很多功能上的方法,把它变成了现在我们所有人都可以用的一个全人类所有的文本的压缩数据集。然后这个数据集是我们做大模型的时候必须要用到的数据集,你做什么都要用,只要你做大模型一定会用到、100% 会用到。有的人可能自己有大模型自己写,但是我们可以直接用 OpenAI 这个东西,省了好多事,只有 OpenAI 做了这件事情,为什么只有 OpenAI 做了这件事情?因为 OpenAI 的工程师们不是水论文的硕士或者博士,而是把算法落地到工程的 AI 的 8 级焊工。我说的很土,就是 8 级焊工,拿着电焊在那里焊东西的工人。
OpenAI 有两个技术领头人,一个是 Stripe 的 CTO,还有一个是算法的架构师,然后 Stripe 这个公司规模化能力很强,正因为有这样的一个组合,才能够把 OpenAI 这个事情落地到产品、落地到工程、落地到大家实际可以用的这样一个地步。因为算法大家都知道,最后真正把它落地得怎么样,看工程。
工程就是把算法带给普罗大众。工程有很多复杂的东西,怎么去理解?我认为工程就是比创造单一产品、单一系统、单一算法更复杂的人造系统。他让一个人把自己的知识和世界上所有的其他这些系统进行关联、组合、排列,这个方法是系统性工程、系统性理论。
举几个例子,左边是发动机,右边是火箭,假如说我们把发动机当作算法,火箭上天本身就是一个工程。怎么运?运了之后怎么弄?歪了之后怎么去调整?这都是工程问题。
左边这个是 GPT 里面最核心的 Transformer 架构,右边是 ChatGPT 的 UI,从左到右,这是一个工程问题。这个架构大家都能知道,我认识很多硕士,17 年 18 年毕业生全都知道这个架构,但是没有一个人把它落地到这个产品、落地到这个工程。这是一个工程问题。
下方是我们的一个案例,这是客户的需求。这件事情用 GPT 可以直接完成,但是要变成我们可以直接使用的东西,就是一个工程问题。右边是我们所有 API 列表树,我们的 API 有 200 万个字符,我要怎么去给到 GPT?因为 GPT 的单个 prompt 只有 4096 个字符。这是一个工程问题,当然也是算法问题,因为算法到极限到不了那个程度,但是我们可以用工程方法来解决这个算法问题。所以这是我们要去讨论的一个问题:在有限的资源情况下、有限的算法算力情况下,我们怎么用工程来解决看上去实现不了的事情,这是一个工程问题。
我 6 月 10 号的时候跟他们讨论完,晚上睡觉没睡着,一直在想那个架构,这个架构就是工程问题。图里有线上数据库、有 LLM、有 Authing 的平台,还有 Authing 的 API 怎么去进行联动。
我也聊了很多做大模型创业的,发现他们都太重视算法,我认为这是不对的。算法、工程至少一半,在某些情况下甚至要算法要 2 分,然后工程要 8 分才能够做出来让客户满意的东西。
我现在要求你们去自我学习、持续学习、归零心态,然后去完成自己的一万个小时,这是你们自己的成长。那对于像 Authing 这样一个组织来说,我们不仅要自我成长,我们还要吸纳更多人才,我们也希望吸纳能够把算法、把工程、把专业知识融合起来的人才。
最后还是放东灵山,Authing 前面还有很长的路要走,还有很多的知识要学习,还有很多的心态要重新进行摆正。包括在每个时代我们发现,两年前我以为做完 Workflow 就已经到头了,基本上在我们这个行业做到绝对领先就可以。然后发现现在还有大模型,这才不到两年,之后还可能有其它的。
所以我们还要持续往上爬、不停往前爬,这是我们持续成长、持续进步的非常重要的基础。然后我也非常希望,在座的所有人都能够