Spring GDS 25è Aniversari
Una empresa de logística que envia a 190 països va construir alguna cosa per enviar-se a si mateixa.
El prompt engineering és la pràctica de dissenyar les instruccions que dones a un model de llenguatge perquè produeixi el resultat que de debò vols. El mateix model pot tornar un paràgraf vague o una resposta neta i estructurada segons com plantegis la petició.
Les tècniques són concretes. Donar al model un rol i un objectiu clars. Mostrar-li uns quants exemples resolts perquè aprengui el patró (few-shot prompting). Demanar-li que raoni pas a pas abans de comprometre's amb una resposta. Especificar el format de sortida exacte, com ara JSON amb camps amb nom, perquè el codi posterior el pugui processar. Un model al qual se li demana "extreu el total, la data i el proveïdor de la factura com a JSON" es comporta de manera molt diferent d'un al qual se li diu "parla'm d'aquesta factura", i aquesta diferència és tota la feina.
El prompt engineering no substitueix el grounding ni el fine-tuning. És la palanca més barata i ràpida que tens, i sovint et porta gairebé fins al final. El buit que queda, on la redacció per si sola no arregla la precisió, és on entren la recuperació i l'avaluació.
Tractem els prompts com a part del codi, no com a text llençable en un notebook. Es versionen, es proven contra entrades reals i es canvien de manera deliberada quan podem demostrar que la nova versió funciona millor. Un prompt que va bé en una prova ràpida sol trencar-se al cinquè cas embolicat, així que construïm el conjunt de proves aviat i deixem que caci les regressions.
Dins de les nostres solucions d'IA i machine learning, el disseny de prompts viu al costat de la recuperació i l'avaluació, no en solitari. Quan construïm chatbots i assistents virtuals, el prompt defineix el to, els límits i la forma de la sortida, i l'ajustem contra les preguntes incòmodes que fan els usuaris reals. És una feina poc vistosa que decideix si el sistema sembla fiable o fràgil.
Obtens resultats inconsistents d'un model que hauria de rendir més? Afinem-lo.
Una empresa de logística que envia a 190 països va construir alguna cosa per enviar-se a si mateixa.
Convertir una marca en un negoci que funciona.
Mig milió de persones. Una app. Zero caos.















