eifachposte

eifachposte

Últimamente están saliendo muchos papers que refutan el título y yo acompaño la idea. Lo cierto es que los modelos basados en predicciones estadísticas (tipo Transformers y la gran mayoría de modelos que se usan hoy en día) no van a lograr tanto como las expectativas que tienen las Big tech de IA. Transformers y todo esos modelos estadísticos no generalizan a menos que haya trillones de datos para entrenarlo y suficiente cómputo, es tonto llamar “generalizacion” a eso; realmente Transformers es copy paste y listo. A qué voy con todo esto? Que debería haber un cambio en la forma en la que se desarrollan los modelos, hacer modelos basados en reglas e invariantes que permitan que el modelo “entienda” realmente lo que está haciendo y no solo haga copy paste. Este post lo acompaño con mi propia investigación sobre todo esto; mi Paper PrePrint, códigos completos open source y modelos libres en HuggingFace junto a sus espacios. Todo para demostrar el alcance que puede llegar a tener está idea. Si tienen alguna duda o cuestionamiento no duden en comentármelo, soy investigador independiente y está conclusión la desarrollé yo mismo (igualmente hay mucha gente que piensa igual). Me gustaría que cualquier comentario que tengan se haga de forma tranquila y sin insultos, estamos acá para compartir ideas y opiniones, no pienso responder comentarios negativos (al menos que me llame la atención responderlos jajajajaj). Denle la oportunidad de por lo menos leer el abstract del PrePrint, les aseguro que les va a interesar. |----------------------------------- PrePrint: https://doi.org/10.5281/zenodo.19141132 HuggingFace (modelos y espacios); https://huggingface.co/DepthMuun Github; https://github.com/DepthMuun/gfn |------------------------------------ el modelo ISN es el más experiental, si bien logra capturar la estructura del lenguaje, viola la ley de usar invariantes, su invariante es un stub por ahora, pero es interesante lo que se logró igualmente. Siento que igualmente me faltó dar más información en este post, cualquier duda me la comentan ;) (No podía hacer crosspost de mi post acá, por si alguien entra a mi perfil y ve el mismo post en otro lado, por eso mismo también si el post llega a violar alguna norma de este subreddit, no tengo problema a qué me lo notifiquen y yo hacer algún cambio. Tampoco sabía que título ponerle, así que si no es el correcto pido mil disculpas :) ) submitted by /u/janxhg27

Originally posted by u/janxhg27 on r/ArtificialInteligence

Los modelos basados en estadísticas no son el camino.

Los modelos basados en estadísticas no son el camino.