OpenAI宣布对GPT-4o和Sora进行重大升级,提供全新文生图模型,可生成高度拟真的图像,号称“逼真到肉眼难辨”,表现甚至超越AI图像生成工具Midjourney等竞争对手,OpenAI大张旗鼓宣扬AI文生图重大更新,AI图片生成俨然已成为下个AI模型赛道,光通讯厂喜迎商机。
业界人士指出,AI影像生成工具陆续问世,将刺激资料传输需求暴增,矽光子及高速光模组可提高资料传输速度,光圣(6442)、波若威(3163)、华星光(4979)、上诠(3363)等光通讯厂,将受惠这波AI影像生成商机。
OpenAI宣布GPT 4o模型的重大更新,是以大量多样化图片和文字训练而成,它本身具备庞大的图文知识及分析上传图片的能力,以生成实用而美观的图片,生成的影像逼真到“肉眼几乎看不出任何破绽”,在精细度、细节和遵循文字指令等方面表现出色。
OpenAI强调,经过“积极后训练”的GPT 4o具备惊人视觉能力,在图像生成方面拥有多项突破,包括可更精确地进行文字渲染与文字整合、多轮生成图像、多模态文本及影像输入与输出,且模型风格转换多样化,从手绘草图到高解析度写实风格,都可灵活转换。
OpenAI执行长奥特曼甚至在直播中兴奋表示,这些图像品质令人惊叹,“我几乎不敢相信它们出自 AI,这是创意自由的新高峰”。
AI图片生成已成为下个AI模型赛道。Google去年12月先前也升级影像生成AI模型至Veo2,效能比OpenAI当时宣布开放的Sora更强大,较劲意味浓厚。
评论
文明上网理性发言,请遵守新闻评论服务协议
登录参与评论
0/1000