CogView4: un modelo gráfico de código abierto para generar imágenes bilingües de alta definición en chino e inglés
Introducción general CogView4 es un modelo de conversión de texto a gráfico de código abierto desarrollado por el KEG Lab (THUDM) de la Universidad de Tsinghua, centrado en la conversión de descripciones de texto en imágenes de alta calidad. Admite la introducción de palabras de referencia bilingües, y es especialmente bueno en la comprensión de pistas chinas y la generación de imágenes con caracteres chinos, no...