Microsoft a prezentat recent două modele lingvistice inovatoare, denumite Phi-4-mini și Phi-4-multimodal, care sunt optimizate pentru procesarea multimodală și eficiență hardware.
Primul model, Phi-4-mini, utilizează 3,8 miliarde de parametrii și este capabil să funcționeze exclusiv cu text. Datorită dimensiunii sale reduse, acesta poate fi rulat local pe un telefon mobil. Modelul se bazează pe o arhitectură care analizează doar textul dinaintea unui cuvânt pentru a-i determina semnificația, ceea ce contribuie la reducerea cerințelor hardware.
Phi-4-mini integrează, de asemenea, o tehnică de optimizare a performanței numită atenția interogării grupate, care îi permite să identifice cele mai relevante puncte de date pentru sarcinile de procesare.
Al doilea model, Phi-4-multimodal, este o variantă avansată a Phi-4-mini, având la bază 5,6 miliarde de parametrii. Acest model are capacitatea de a procesa nu doar text, ci și imagini și video.
Conform declarațiilor Microsoft, noile modele lingvistice s-au dovedit a fi superioare concurenței în cadrul mai multor teste sintetice.