OpenAI这周发布了ChatGPT Images 2.0,他们说这标志着图像生成进入了一个全新的阶段。Images 2.0是升级后的模型,能更好地处理各种复杂的视觉任务。
它可以严格按照详细的指令来操作,准确放置和关联物体,保留精细的细节,还能很好地处理密集的画面布局。Images 2.0是OpenAI首个具备思考能力的图像模型,同时构图感和视觉品味也明显提升,OpenAI表示,这样生成出来的图片会更自然,不那么像AI作品。
Images 2.0还能上网搜索实时信息,一个提示就能生成最多八张图片,并且会自己检查输出结果。图片支持多种比例,最高可以达到2K分辨率。新模型对多语言的理解也更强了,在渲染日文、韩文、中文、印地语、孟加拉语等非拉丁文字时表现更好。
现在,所有ChatGPT、Codex和API用户都能直接使用Images 2.0了。







