大模型如何落地?怎么落地?成为今年科技领域的头号主题。
在一个不为大多数人所知道的造字赛道中,这家清华创业公司——「图形起源」悄然实现商业变现:
帮助字体公司降低80%成本,提速10倍以上。Canva可画上最受欢迎的前100套中文字体,大部分都是用他们的算法生成的。
这个赛道足够小也确实刚需,设计公司、字体公司苦版权费用久矣。
而他们凭借原本积累的图形学与AI的技术优势,实现了人工所不能及的效率和精度。
来看看他们是如何发现以及靠AI造字来赚钱的。
靠AI造字赚钱,提速10倍以上
首先来了解一下什么是字体生产?
传统的字体生产流程,往往需要设计师用手写的方式来完成整套字体的制作,(一套字体最多近3万字)并且在初稿完成后,还需要人工团队进行逐字校对。
因为纯人工操作,这样一套流程下来不仅周期长,往往需要一个季度。对于字体公司来说,这是一笔不小的成本支出。
与此同时,也正因为人工,单个字体字形质量风格等细节上不好把控。
对于设计公司来说,制作过程中的高成本,也导致了商用版权字体采买费用的高昂。
正是在同客户交流时,图形起源团队发现了这一行业痛点,耗时数月打造了一套字体生产线。
这不是简单应用一个大模型就能直接生成的。字体设计最大的区别在于它是矢量图,可以无限放大而不失真。而目前AI生成的图通常是位图,有像素限制。
如何让AI生成矢量图,理解字体的锚点和矢量曲线的含义,成为核心的技术难点。
创始人史海天分享了他们的解决思路,整个流程分为四个阶段:
首先,用一个传统的Diffusion模型会生成位图;
其次,用第二个超分辨率模型,把字体位图的分辨率提到最高;
然后,用一种独特的算法,让AI能够理解什么是“好的矢量设计”,设计第三个模型,以这种“好“的审美作为优化目标,用训练后的模型把位图转化成矢量图;
最后,训练一个专门检查错别字和字形结构的模型。
除此之外,他们还计划开发笔画拆分模型。
基于这样的模型,他们能实现人类所不能达到高效和高质量。
比如基于AI超分技术和AI矢量化,像各种笔画、偏旁部首的边缘细节处理,能禁得起任意放大维度,设计师能在海报等场景中使用。
客户只需要完成前199个字的操作,AI就能在两天内训练并生成数万字。并且也不限于简体,像繁体字、生僻字,日文韩文拉丁这样的多语种也OK。
在准确率上,简单字形(笔画<15)单次生成的平均生成错字率小于1%,复杂字形(笔画≥15)单次生成的平均生成错字率小于5%,已经远高于人工审校的准确度。
现在他们还打造了一个SaaS平台,整个交付过程都可以在线上进行。客户能随时查看进度,或自己完成全部生产过程,不用图形起源的人工干预。
据透露,目前他们已经生成了346套字体,累计4680244个字。
来自图形起源
图形起源成立于2020年底,是由当时清华大学车辆学院毕业生史海天,读硕士休学时候创办。
在此之前,他们主要做3D创作引擎,并完成了三轮融资,受到像五源资本、真格基金等机构的青睐。当时他们的愿景是,希望在未来建立一个大众化的3D内容创作工具,以及一个普通人愿意在其中生活的社交世界。
不过现在史海天回忆当时没有找到很好的变现场景,如今大模型的到来,带给他们全新的机遇。
当时他们花了很长时间和资金来验证这件事情。史海天透露,他们当时训了两个大模型,一个用来识别,一个用来生成,训练目标是AI生成的字体让AI分辨不出。
不过这个行业的优点在于,字体数据是比较全的,比如一套字能喂给AI一半字,让AI可以生成剩下一半字。
最后他们也实现了交付级别的生成效果,目前一周能完成超过40套字体的交付,相当于效率提升了几百倍。
目前公司主要有两个主营业务。
中文字库扩写,也就是客户给参考字体文件,图形起源AI先进行一波学习,然后生成风格统一的字形。
整个流程都是在SaaS平台上进行,平台上支持人工校对、二次学习、批量生成、人工二次筛选等工作,以进一步降低生成字体的错字率。
跨语种风格迁移。顾名思义,就是根据任意语种任意字体,来生成同种风格的任意语种任意字形。
目前他们能够稳定生成中日韩拉丁字母、希腊字母、西里尔字母,常见符号数字等,并且已经在小米应用商店有售卖。
而像藏文、阿拉伯文等小语种文字还在内测阶段。
最后想说,虽然现在看各个大厂都在卷生产力场景,市场很卷。但是具体到各个细分场景下,大企业也许就没有那么多的资金精力去投入。
那些场景看上去需求有限,但确实同样也是强刚需,也能实现商业变现。比如字体,比如排版。
对于创业公司来说,就是个不错的切入点。图形起源就是一个。
如今大模型应用如火如荼,到底还是看能不能解决实际问题。这条真理已经是再明确不过了。