全球首家AI餐厅开业
2023年,我们看到了扩散模型推理速度方面的一些重大理论改进,例如Song等人的原始一致性模型论文,以及最近的LCM。(另外,对抗扩散蒸馏。)我们已经开始看到使用这些想法的项目,例如Dan Wood的Art Spew(每秒77512×512图像,在单个4090上)、Modal的Turbo.art(基于SDXL Turbo) 和fal.ai的30fps脸部交换。
论文网址:https://arxiv.org/abs/2401.00368
GitHub Copilot是一个AI辅助编码的工具,可以帮助你更快地编写代码。
2、LLaVA、CogAgent和BakLLaVA是三种具有极大潜力的开源视觉语言模型。