Hola, este es el primer post que escribo totalmente con audio, es decir, que lo dicto en lugar de escribirlo. Estoy usando un programa que se llama Speech Note. Voy a dictar primero el post completo y después editarlo un poquito en Obsidian. Aún no encuentro un flujo que me sirva bien para hacer este tipo de cosas, estoy experimentando, y es importante escribir acerca del proceso, porque muchas veces alguien más puede tenet una buena solución. El post es sobre la semana, sobre las cosas que he hecho últimamente. Justo ahora estoy esperando a ver cuánto tiempo puede grabar de corrido el programa. Porque hace poco estaba intentando poner un post y de repente se pausó y lo peor es que no avisa y se pierde un poco. La realidad es que no graba tanto, pero aún así está bastante bien, sólo que hay que estar pendiente para no perder información. Tengo que irme poco a poco, de párrafo en párrafo, y necesita un poco de edición, pero me gusta porque no está haciendo llamadas hacia ningún servidor remoto, sino que funciona completamente en local.
Hace dos semanas, estuve en un maratón de usar bolt.new intentando terminar un proyecto que tenía allí. Se iba a vencer mi suscripción profesional y quería aprovechar al máximo los tokens que me quedaban. Al final falló, se supone que me daban 10 millones de tokens por mes y en 20 minutos del último día en la mañana consumió 14 millones de tokens, es el plan más básico de 25 dólares. Había algo que no sabía hacer e iteró e iteró, sin lograr resultados pero siempre consumiendo tokens, se echó los 20 millones de tokens que me quedaban sin entregar resultados, ¿suena familiar? Aún tengo pendiente escribir un post sobre eso y otras plataformas.
Aunque la inteligencia artificial va mejorando bastante rápido, aún no es suficiente, y uno tiene que tener mucho dinero para lograr esa eficiencia, al menos es lo que he visto hasta ahora. En ese sentido, creo que es muy interesante ver cómo surgió una tendencia que dice que lo importante es el contexto, más allá de cuántos tokens se pueden enviar y recibir, ¿Cómo se interpreta?¿Cómo se almacena?¿Cómo se va resumiendo el contexto para sacar más provecho de los tokens que se envían? A mí me parece que es bastante cierto, y complementariamente se está generalizando el usar distintos tipos de modelos para distintos tipos de tarea. Ahora es común con un mismo agente usar varios tipos de modelo dependiendo de la tarea, lo cual puede economizar bastante y mejorar bastante la efectividad de los agentes para ejecutar tareas complejas.
No estoy muy metido en el tema de los modelos locales, me he querido meter más, pero existen varias circunstancias que lo han hecho muy difícil, la principal de ellas es tener que aprender mucho porque no me gusta hacer las cosas sin entender, que no tiene nada que ver con delegar o no. La segunda es que quiero hacer otras cosas y, al final, meterse de lleno también se acaba todo el día, en este punto, y yo creo que seguirá siendo igual en el futuro, el gestionar los agentes sigue siendo un trabajo de tiempo completo, como lo ha sido históricamente administrar.
Otra de las cosas que quiero hacer es poner un servidor de traducción automática, mío, sólo para uso personal. Después de lo que pasó con bolt.new, empecé a trabajar en terminar una página web para una amiga y uno de los problemas era que necesitábamos hospedar archivos pesados en S3, al final me decidí por una arquitectura bastante simple, pero aún así me tomó bastante tiempo configurarlo bien, con certificados y demás. Hoy ya está en producción y también es algo sobre lo que quería escribir, me parece que a veces la narrativa que se hace de las nuevas plataformas es un poco engañosa y además es bastante difícil anticipar los detalles. Al final, estaba haciendo autenticación con Supabase y pensé en usar funciones, exploré Cloudflare, terminé por usar una alternativa más simple, solo que eso me llevó a tener que hospedar yo mismo el proyecto, lo que tenía algunos otros detalles por solucionar, fue algo bastante divertido, para los que nos gusta el desarrollo y las cosas técnicas, pero también mucho más largo de lo que esperaba.
El proyecto final es bastante simple, se trata de un gateway, un reverse proxy, encima de filestash, que es un proyecto open source para un sistema de archivos web. Usé Supabase como autenticación y después usé Caddy como reverse proxy. Para usar caddy, tuve que crear mi propia autenticación en el servidor, en la declaración del archivo de caddy. Voy a escribir un post mucho más detallado, y técnico, pero a grandes rasgos fue eso lo que hice. Pensé que era un proyecto de un par de horas y terminé tardándome casi una semana, con varios cambios debidos a lo que iba descubriendo sobre la marcha.
Después de completar eso empecé a trabajar en una sitio para un amigo, usando Astro, de un sitio demo para un portafolio de arquitectura. Fue relativamente simple, o ha sido, porque aún no lo termino, pero tiene algunos pequeños detalles, en este caso sobre todo de la parte social, los requisitos técnicos del proyecto. Las herramientas están ahí, pero la integración no es tan sencilla como parecería.
En otros temas he dejado de lado la parte de chino, mandarín, y también he dejado de lado la aplicación para ayudar a leer que tenía, que había estado construyendo para mi hija. Ahora ella ha continuado mejorando, pero hay cosas que le cuestan trabajo y también tiene algunos problemas con matemáticas, son bastante simples, y tiene una actitud muy positiva, hace unos meses le dije, y no mentía, que nuestra familia siempre ha sido buena con las matemáticas, y eso facilitó mucho su camino. No son problemas graves, sino que es una transición difícil entre lo que estaba acostumbrada en preescolar, en donde podía jugar mucho y distraerse y lo que se espera de ella ahorita. Algo que me preocupa es que una persona me dijo que va a ser aún más difícil ahora que entre a segundo año, estoy pensando como volver a estos proyectos, y, particularmente, como usar la inteligencia artificial para crear un par de aplicaciones pequeñas, que espero que puedan ser usadas para reforzar su aprendizaje y el de otros niños. Algo sobre lo que he estado pensando es que es muy malo el enfoque actual de la tecnología, dominado por la idea de capitalismo implacable. Las tecnologías no son malas pero no tienen como propósito ayudar a concentrarse, sino todo lo contrario, buscan crear adicciones que sean difícilmente controlables por los clientes. Terminan por hacer que se distraiga más fácilmente, sus intervalos de atención (y los nuestros como papás) duran menos. Es un problema bastante grave, y se trata de un problema de diseño por cómo hemos orientado nuestra sociedad y nuestras instituciones, particularmente comerciales.