Թոքենների «խելահեղ» ծախսը փորձության է ենթարկում AI-ի վրա դրված գործատուների խաղադրույքը

Գեներատիվ արհեստական բանականության (AI) նկատմամբ սկզբնական «ոսկու տենդը» փոխակերպվել է։ Մինչ ընկերությունները փորձնական նախատիպերից անցում են կատարում դեպի կորպորատիվ մասշտաբի ինտեգրում, քննարկումների առանցքում «ի՞նչ կարող է անել այս մոդելը» հարցից դարձել է «որքա՞ն արժե մեկ հարցումը» հարցը։ Մենք մտնում ենք Tokenomics-ի (թոքենների տնտեսագիտության) դարաշրջան, որտեղ LLM-ների (լեզվական մեծ մոդելների) թոքենները՝ որպես անտեսանելի արժույթ, դառնում են թվային փոխակերպման բյուջեի հիմնական ծախսային հոդվածը։

Թոքենների օգտագործման թաքնված բարդությունը

Այս մարտահրավերի հիմքում ժամանակակից AI-ի ճարտարապետական իրողությունն է։ Մոդելի հետ յուրաքանչյուր փոխգործակցություն՝ լինի դա հաճախորդների սպասարկման chatbot, թե ծրագրավորման ներքին օգնական, չափվում է թոքեններով՝ տեքստի այն հատիկավոր միավորներով, որոնք մշակում են մոդելները։ Բիզնեսի համար սա ստեղծում է ծախսային անկայուն կառուցվածք։ Ի տարբերություն ավանդական ծրագրային բաժանորդագրությունների, որոնք հաճախ ֆիքսված գին ունեն, AI-ի սպառումը փոփոխական է և չափազանց դժվար է կանխատեսելի։

Բարձր արագությամբ գործող միջավայրերը, ինչպիսիք են էլեկտրոնային առևտրի հարթակները, որոնք մշակում են հազարավոր հարցումներ, կամ ծրագրային ապահովման ընկերությունները, որոնք օգտագործում են AI-ն միլիոնավոր տող կոդի կարգաբերման համար, բախվում են այն խնդրին, որ չօպտիմիզացված հարցումները (prompts) հանգեցնում են «թոքենների արտահոսքի»։ Մեկ ոչ արդյունավետ հարցման կառուցվածքը կարող է հանգեցնել չափազանց երկար, ավելորդ կամ անհարկի բարդ պատասխանի, ինչը պարզ գործառնական գործողության արժեքը բազմապատիկ մեծացնում է։

Ծախսերի այս աճի հիմնական գործոններն են.

Prompt Bloat (հարցման ուռճացում). API կանչի մեջ ավելորդ համատեքստի կամ ոչ պիտանի պատմական տվյալների ներառումը։
Կրկնվող խոսակցական ցիկլեր. AI գործակալներում հիշողության կառավարման անարդյունավետությունը, որը ստիպում է մոդելին ամեն անգամ վերամշակել խոսակցության ամբողջ պատմությունը։
Մոդելի սխալ ընտրություն. Բարձր պարամետրերով «առաջնային» (frontier) մոդելի օգտագործումը ցածր բարդության առաջադրանքների համար, որոնք կարող էին լուծվել ավելի մատչելի և մասնագիտացված մոդելով։

Կայուն AI ROI-ի օպտիմիզացում

Բիզնեսի ղեկավարների համար նպատակը AI-ից հրաժարվելը չէ, այլ «թոքենների նկատմամբ գիտակից» ճարտարագիտության ներդրումը։ Ներդրումների դրական եկամտաբերության (ROI) հասնելու համար անհրաժեշտ է փոխել մոտեցումը, թե ինչպես են ծրագրավորողներն ու գործառնական թիմերը կառավարում այդ մոդելները։ Այլևս բավարար չէ պարզապես միացնել API բանալին. ընկերությունները պետք է LLM-ների աշխատանքը վերահսկեն նույն խստությամբ, ինչպես ամպային պահեստավորման կամ սերվերային ենթակառուցվածքների ծախսերը։

Վերահսկողությունը վերականգնելու համար կազմակերպությունները գնալով ավելի շատ են կենտրոնանում հետևյալի վրա.

Քեշավորման ռազմավարություններ. Մոդելի հաճախակի պատասխանները պահպանելը՝ նույն բովանդակությունը կրկին չգեներացնելու համար։
Chain-of-Thought օպտիմիզացում. Ներքին գործընթացների կատարելագործում, որպեսզի գործակալները քաղեն միայն անհրաժեշտ տվյալները՝ փոխանակ ամբողջ տվյալների բազան մոդելին «կերակրելու»։
Հիբրիդային օրկեստրացիա. Հարցումների ուղղորդում դեպի ավելի էժան և փոքր մոդելներ՝ առօրյա ավտոմատացման համար, միաժամանակ պահպանելով հզոր LLM-ները բարդ և բարձր արժեք ունեցող որոշումների կայացման համար։

Հաջորդ ֆինանսական տարվա կտրվածքով հաղթող կլինեն այն կազմակերպությունները, որոնք կտիրապետեն AI-ի հնարավորությունների և ծախսերի արդյունավետության հավասարակշռությանը։ Շեշտադրումը «ավելի շատ AI»-ից պետք է տեղափոխվի «ավելի խելացի AI», որտեղ ճարտարապետությունը նախագծված է թոքենների սպառումը նվազագույնի հասցնելու համար՝ առանց որակը կամ օգտակարությունը զոհաբերելու։ Այս փոփոխականները կանխատեսելու և վերահսկելու ունակությունը կտարբերի նրանց, ովքեր հաջողությամբ ինտեգրում են AI-ն իրենց բիզնես մոդելում, նրանցից, ում համար տեխնոլոգիան կդառնա մասշտաբով պահպանելու համար անհամեմատ թանկ։

AI-ի արդյունավետ ինտեգրումը պահանջում է ոչ միայն մոդելների հասանելիություն, այլև սպառման կառուցվածքային մոտեցում։ AOODAX-ում մենք մասնագիտացած ենք հատուկ AI գործակալների ստեղծման մեջ, որոնք նախագծված են բարդ աշխատանքային հոսքերը կառավարելու համար՝ պահպանելով ռեսուրսների օգտագործումը (ներառյալ թոքենների ծախսերը) օպտիմալ և ձեր բիզնես նպատակներին համահունչ։

Թոքենների «խելահեղ» ծախսը փորձության է ենթարկում AI-ի վրա դրված գործատուների խաղադրույքը

Թոքենների օգտագործման թաքնված բարդությունը

Կայուն AI ROI-ի օպտիմիզացում

Կապված Հոդվածներ

Plaud-ի ծրագրային ապահովման տարեկան եկամուտը գերազանցել է 100 մլն դոլարը՝ 2 մլն-ից ավելի AI նոթատետրերի վաճառքից հետո

Android 17-ը թողարկվել է բազմաֆունկցիոնալ նոր գործիքներով և ընդլայնված Gemini գործառույթներով

Theker-ը 85 միլիոն դոլար է ներգրավել՝ ունիվերսալ գործարանային ռոբոտ ստեղծելու համար

Եկեք Կառուցենք Ինչ-Որ Բան Միասին