Lo sé, lo sé, nadie va a leer esto porque en vez de dedicarme a abrir un newsletter en la web y mejorarla (tal vez que no tarde 32 segundos en cargar) pierdo el tiempo en crear chorradas con IA, pero bueno… ya que lo hice aquí te lo presento:
Un día andaba por YouTube como siempre cuando me encontré con un interesante tutorial de «como conseguir novia» [https://www.youtube.com/watch?v=UEE7PBOec2g] y mi mente de programador (mentira) dijo, es fácil conse… que diga… ESTO LO AUTOMATIZO YO DE 3 PATADAS, y asi me puse a crear un increíble proyecto que no tiene absolutamente nada de utilidad, pero bueno.
Comencé el proyecto y pasó una cosa, en el instituto, si, lo confirmo, estoy estudiando todavía en el instituto, y en una conversación con mi mejor amiga estuvimos hablando de que no iría al viaje de fin de curso, algo que a ella siempre le había hecho ilusión, así que acabe dedicando el proyecto a intentar crear un canal de youtube automatizado con este proyecto, ganar algún dinero e intentar pagarle el viaje, así que no voy a perder la oportunidad e promocionarte el canal youtube.com/@don_geminiano y obciamente un GoFoundMe, que si puede ser, agradecería muchísimo que compartieran y mas aún si donan:
Ahora que acabe con la chapa veamos…
¿Que carajos hace SIMIO-ESCLAVO y porque se llama asi?
Simio esclavo es un programa que, usando la IA de Google, Flux dev, Tor y PyTTSx3 (aunque puede usarse Coqui-TTS si quieres) obtiene ideas para videos desde un comentario de YouTube, la mejora, prepara un guion, el seo, la portada, genera el video, lo renderiza y lo sube a youtube, todo en unos 20 minutos máximo.
A, y su nombre son siglas, concretamente Sistema Inteligente de Movimiento y Optimización Épica de Sonidos, Creación y Lógica Audiovisual Visualmente Organizado, para nada preparado.
Me encantó, ¿cómo funciona?
Básicamente SIMIO-ESCALVO usa 8 scripts increíbles para generar el video:
- todo.py
- info.py
- video.py
- calidad.py
- postproceso.py
- yt.py
- portada.py
- comunidad.py
todo.py (Básicamente maneja todo)
todo.py es el archivo principal, se encarga de coordinar todos los demás y maneja el proceso.
info.py (La magia, donde está la IA)
Aquí se encuentra básicamente todo lo relacionado con la generación bruta del contenido, crea todo sin más empleando la IA de google que no se como demonios sigue gratuita, pero bueno, no nos vamos a quejar, que está aquí: https://aistudio.google.com/apikey y una vez conseguido devuelve la información necesaria para el video
video.py (El generador del video)
Este, junto a info.py es el script «Chicha» del programa, de forma muy resumida, primero genera el guion del audio, luego extrae en que momento se dice cada palabra usando Whisper de ClosedAI (si, estos tíos tienen un modelo ¡¡¡¡OPEN SOURCE!!!! ni yo me lo creía la verdad, un Danipunto para ClosedAI), una vez extraídas las palabras busca una imagen para cada una en internet a través de TOR, las ordena y finalmente renderiza todo.
calidad.py (Mejora todo un poquito, o tal ves demasiado)
Bueno… esto no es obligatorio pero al descargar todas las imágenes este script activa una GUI rápida para modificar imágenes que pueden no corresponder con la palabra, que suele pasar, para ellos tiene una búsqueda integrada en el que es literalmente seleccionar y reemplazar, o incluso para palabros tenemos el generador de imagenes con palabras (generar -> reemplazar y hecho) o directamente seleccionar del ordenador, no se si algún día añadiré el crear con IA. Esto es necesario hacerlo durante los primeros 10 videos, una vez ya empeines a tener un diccionario bastante comprobado puedes abandonar esta pestaña, comentando la línea que la activa en video.py.
postproceso.py (Simplemente añade cambios predefinidos)
Quieres una intro o uuna outro pues este es el sitio, aquí puedes añadir todo eso, se que podria renderizar en video.py y añadir este codigo a video.py en los clips directamente pero soy un vago, dejenme (ya vendrá en alguna actualización futura).
yt.py (El amigo de Google)
Fácil, se comunica con la API de youtube y hace alguna que otra chorrada.
portada.py (Crea portadas y ya)
Usando la API (gratis, SIII, VAMONOOOS) de SegMing nos crea una increíble portada con la IA Flux [dev] y luego le pone algún texto encima, ese texto y el promt de la imagen lo crea también una IA, que está aquí, no en info.py.
comunidad.py (Responde a tus fieles 0 seguidores :D)
Simplemente analiza los comentarios, los responde, y a tomar por saco, de momento no recomiendo usarlo (que por cierto este script se activa manualmente cada vez que se quiera usar) ¿por qué? pues porque tiene un error de autenticación que me da verdadera pereza arreglar que provoca que no pueda usar el mismo token el programa para subir videos a youtube que para publicar comentarios, ya lo arreglare en otro momento, solución fácil por ahora pues metelo en otra carpeta y inícialo desde ahí xd.
No me mientas, seguro tiene cosas malas
La IA puede decir barbaridades, comprueba todo lo que dice (de hecho es MUY PROPENSA a decir locuras.).
Puede ocupar mucho espacio en el disco con un uso extenso (100G para 15 videos de 12 min).
Necesita mínimo 16 Gigas de RAM para videos de 5 minutos o así y el ordenador se congela completamente durante el renderizado.
Recuerda cambiar los system prompts y añadir tus claves de APIs
Necesitarás tener ImageMagic
¿Donde lo descargo máquina?
JAJAJA, que gran chiste, de momento en ningún sitio, tengo que limpiar todo el código de claves APIs, archivos temporales, ver las dependencias y preparar todo, osea que dale tiempo a que tenga ganas.
Además como se que me voy a olvidar voy a poner aquí una nota para mi yo del futuro: Poner el requirements.txt ehh, no te olvides
Además voy a poner el botón de descargar solo para fastidiar a quien no leyó esto, y no se… te va a llevar a mi cuenta de IG mismo.