La AGI no se va a lograr con modelos puramente estadísticos
Últimamente están saliendo muchos papers que refutan el título y yo acompaño la idea.
Lo cierto es que los modelos basados en predicciones estadísticas (tipo Transformers y la gran mayoría de modelos que se usan hoy en día) no van a lograr tanto como las expectativas que tienen las Big tech de IA. Transformers y todo esos modelos estadísticos no generalizan a menos que haya trillones de datos para entrenarlo y suficiente cómputo, es tonto llamar "generalizacion" a eso; realmente Transformers es copy paste y listo.
A qué voy con todo esto? Que debería haber un cambio en la forma en la que se desarrollan los modelos, hacer modelos basados en reglas e invariantes, que permitan que el modelo "entienda" realmente lo que está haciendo y no solo haga copy paste.
Este post lo acompaño con mi propia investigación sobre todo esto; mi Paper PrePrint, códigos completos open source y modelos libres en HuggingFace junto a sus espacios. Todo para demostrar el alcance que puede llegar a tener está idea.
Si tienen alguna duda o cuestionamiento no duden en comentármelo, soy investigador independiente y está conclusión la desarrolle yo mismo (igualmente hay mucha gente que piensa igual).
Me gustaría que cualquier comentario que tengan se haga de forma tranquila y sin insultos, estamos acá para compartir ideas y opiniones, no pienso responder comentarios negativos (al menos que me llame la atención responderlos jajajajaj).
Denlen la oportunidad de por lo menos leer el abstract del PrePrint, les aseguro que les va a interesar.
|-----------------------------------
PrePrint: https://doi.org/10.5281/zenodo.19141132
HuggingFace (modelos y espacios); https://huggingface.co/DepthMuun
Github; https://github.com/DepthMuun/gfn
|-------------------------------------
el modelo ISN es el más experiental, si bien logra capturar la estructura del lenguaje, viola la ley de usar invariantes, su invariante es un stub por ahora, pero es interesante lo que se logró igualmente.
Siento que igualmente me faltó dar más información en este post, cualquier duda me la comentan ;)