Ferret-UI:苹果开发出能“看懂”手机屏幕上并能执行任务的多模态模型

Ferret-UI是由苹果开发的一个专门理解和与移动用户界面(UI)互动的多模态大语言模型(MLLM)。 它把 … 继续阅读Ferret-UI:苹果开发出能“看懂”手机屏幕上并能执行任务的多模态模型