સ્પાસી, એક પ્રાકૃતિક ભાષા પ્રક્રિયા પુસ્તકાલય

વિસ્ફોટ એ.આઈ. નાં પ્રક્ષેપણનું અનાવરણ કર્યું મફત પુસ્તકાલયનું નવું સંસ્કરણ A સ્પાસી»જેનો અમલ છે કુદરતી ભાષા પ્રોસેસિંગ એલ્ગોરિધમ્સ (એનએલપી) વ્યવહારમાં, આ પ્રોજેક્ટનો ઉપયોગ ઓટોરિસ્પોન્ડર્સ બનાવવા માટે થઈ શકે છે, બotsટો, ટેક્સ્ટ ક્લાસિફાયર અને વિવિધ સંવાદ સિસ્ટમ્સ કે જે શબ્દસમૂહોનો અર્થ નક્કી કરે છે.

પુસ્તકાલય સતત API પ્રદાન કરવા માટે રચાયેલ છે તે વાસ્તવિક ઉત્પાદનોમાં ઉપયોગમાં લેવાતા અને ઉપયોગમાં લેવાતા અલ્ગોરિધમ્સ સાથે જોડાયેલ નથી. પુસ્તકાલય એનએલપીમાં નવીનતમ પ્રગતિઓ અને સૌથી કાર્યક્ષમ ગાણિતીક નિયમોનો ઉપયોગ કરે છે પ્રક્રિયા માહિતી માટે ઉપલબ્ધ.

જો વધુ કાર્યક્ષમ અલ્ગોરિધમનો દેખાય છે, તો લાઇબ્રેરી તેમાં પસાર કરવામાં આવે છે, પરંતુ આ સંક્રમણ એ API અથવા એપ્લિકેશંસને અસર કરતું નથી.

સ્પાસીની એક સુવિધા તે એક દસ્તાવેજ સંપૂર્ણ દસ્તાવેજો પર પ્રક્રિયા કરવા માટે રચાયેલ છે, પ્રિપ્રોસેસર્સમાં પ્રિપ્રોસેસિંગ વિના કે જે દસ્તાવેજને શબ્દસમૂહોમાં વહેંચે છે. નમૂનાઓ બે વર્ઝનમાં ઓફર કરવામાં આવે છે: મહત્તમ ઉત્પાદકતા અને મહત્તમ ચોકસાઇ માટે.

સ્પાસીની મુખ્ય લાક્ષણિકતાઓ:

  • લગભગ 60 ભાષાઓ માટે સપોર્ટ.
  • પહેલેથી જ વિવિધ ભાષાઓ અને એપ્લિકેશનો માટે પ્રશિક્ષિત મોડેલ.
  • બીઇઆરટી (બિડિરેક્શનલ એન્કોડર રેન્ડરિંગ્સ ઓફ ટ્રાન્સફોર્મર્સ) જેવા અગાઉના પ્રશિક્ષિત ટ્રાન્સફોર્મર્સનો ઉપયોગ કરીને મલ્ટિટાસ્ક લર્નિંગ.
  • પ્રી-પ્રશિક્ષિત વેક્ટર્સ અને શબ્દ એમ્બેડ્સ માટે સપોર્ટ.
  • સારો પ્રદ્સન.
  • જોબ-onન-ટ્રેનિંગ સિસ્ટમ મોડેલનો ઉપયોગ કરવા માટે તૈયાર.
  • ભાષાકીય રીતે પ્રેરિત ટોકનાઇઝેશન.
  • ઉપયોગમાં લેવાતા તત્વો નામવાળી કંપનીઓને જોડવા માટે, ભાષણના ભાગોને ચિહ્નિત કરવા, ટેક્સ્ટને વર્ગીકૃત કરવા, ટ tagગ આધારિત અવલંબનનું વિશ્લેષણ કરવા, વાક્યોને વિભાજિત કરવા, ભાષણના ભાગોને ચિહ્નિત કરવા, આકારશાસ્ત્ર વિશ્લેષણ, સ્ટેમિંગ વગેરે માટે ઉપલબ્ધ છે.
  • વૈવિધ્યપૂર્ણ ઘટકો અને લક્ષણો સાથે વિધેય વિસ્તૃત કરવા માટે આધાર.
  • પાયટોર્ચ, ટેન્સરફ્લો અને અન્ય ફ્રેમવર્કના આધારે તમારા પોતાના મોડેલો બનાવવા માટે સપોર્ટ.
  • નામવાળી એન્ટિટી બંધનકર્તા અને સિંટેક્સ વિઝ્યુલાઇઝેશન (એનઇઆર, નામવાળી એન્ટિટી રેકગ્નિશન) માટે બિલ્ટ-ઇન ટૂલ્સ.
  • પેકેજિંગ અને જમાવટનાં મોડેલો અને વર્કફ્લોનું સંચાલન કરવાની સરળ પ્રક્રિયા.
  • ઉચ્ચ ચોકસાઈ.

પુસ્તકાલય પાયથોનમાં સાયથોનમાં તત્વો સાથે લખાયેલું છે, એક પાયથોન એક્સ્ટેંશન જે સી ભાષામાં ડાયરેક્ટ ફંક્શન ક allowsલિંગને મંજૂરી આપે છે.

પ્રોજેક્ટ કોડ એમઆઈટી લાઇસન્સ હેઠળ વહેંચાયેલું છે. ભાષાના મ modelsડેલો 58 ભાષાઓ માટે તૈયાર છે.

સ્પાસી 3.0 ના નવા સંસ્કરણ વિશે

સ્પાસી version.. સંસ્કરણના અમલીકરણ માટે સ્પષ્ટ છે મોડેલ પરિવારો 18 ભાષાઓ માટે ફરીથી પ્રશિક્ષિત અને 59 પાઈપલાઈનો તાલીમબદ્ધ 5 નવી ટ્રાન્સફોર્મર-આધારિત પાઇપલાઇન્સ સહિત કુલ

મોડેલ ત્રણ વર્ઝનમાં પ્રસ્તુત છે (16 એમબી, 41 એમબી - 20 હજાર વેક્ટર અને 491 એમબી - 500 હજાર વેક્ટર) અને સીપીયુ લોડ હેઠળ કામ કરવા માટે શ્રેષ્ટ થયેલ છે અને ટોક 2 વેક, મોર્ફોલોઝર, પાર્સર, સેન્ટર, નેર, એટ્રિબ્યુટ_રૂલર અને લેમટાઇઝર ઘટકોનો સમાવેશ કરે છે.

અમે સ્પાસી વી 3.0 પર એક વર્ષથી કામ કરી રહ્યા છીએ, અને જો તમે થિંક પર કરેલા બધા કામોને ગણીએ તો લગભગ બે વર્ષ. લોન્ચ સાથેનું અમારું મુખ્ય ધ્યેય સ્પેક્સમાં તમારા પોતાના મોડેલ્સ લાવવું વધુ સરળ બનાવવાનું છે, ખાસ કરીને ટ્રાન્સફોર્મર્સ જેવા અત્યાધુનિક મોડલ્સ. તમે તમારી બધી સેટિંગ્સને વર્ણવવા માટે અમારા અદ્ભુત નવી ગોઠવણી પ્રણાલીનો ઉપયોગ કરીને, પાયટોર્ચ અથવા ટેન્સરફ્લો જેવા ફ્રેમવર્કમાં સ્પાસી ઘટકો ખવડાવતા મોડેલો લખી શકો છો. અને કારણ કે આધુનિક એનએલપી વર્કફ્લોમાં ઘણીવાર ઘણા પગલાઓ હોય છે, તેથી તમારા કાર્યને વ્યવસ્થિત રાખવામાં તમારી સહાય માટે એક નવી વર્કફ્લો સિસ્ટમ છે.

અન્ય મહત્વપૂર્ણ નવીનતાઓ જે નવા સંસ્કરણથી અલગ છે:

  • તાલીમ મ modelsડેલો માટે નવું વર્કફ્લો.
  • નવી રૂપરેખાંકન સિસ્ટમ.
  • મલ્ટિટાસ્કીંગ શીખવા માટે યોગ્ય ટ્રાન્સફોર્મર-આધારિત પાઇપલાઇન મોડેલો માટે સપોર્ટ.
  • પાયટોર્ચ, ટેન્સરફ્લો અને એમએક્સનેટ જેવા વિવિધ મશીન લર્નિંગ ફ્રેમવર્કનો ઉપયોગ કરીને તમારા પોતાના મોડેલોને કનેક્ટ કરવાની ક્ષમતા.
  • પૂર્વ-પ્રક્રિયાથી મોડેલના અમલીકરણ સુધીના વર્કફ્લોના તમામ તબક્કાઓનું સંચાલન કરવા માટે પ્રોજેક્ટ સપોર્ટ.
  • ડેટા વર્ઝન કંટ્રોલ (ડીવીસી), સ્ટ્રીમલાઇટ, વેઇટ્સ અને બાયસિસ અને રે પેકેજો સાથેના એકીકરણ માટે સપોર્ટ.
  • નવા બિલ્ટ-ઇન કમ્પોનન્ટ્સ: સેન્ટેશન રેકગ્નાઇઝર, મોર્ફોલોજાઇઝર, લેમટાઇઝર,
  • એટ્રિબ્યુટરેલર અને ટ્રાન્સફોર્મર.
  • તમારા પોતાના ઘટકો બનાવવા માટે નવી API.

છેલ્લે, જો તમને તેના વિશે વધુ જાણવામાં રસ છે આ નવા સંસ્કરણનું અથવા સ્પાસી વિશે, તમે વિગતો ચકાસી શકો છો નીચેની કડીમાં


તમારી ટિપ્પણી મૂકો

તમારું ઇમેઇલ સરનામું પ્રકાશિત કરવામાં આવશે નહીં. આવશ્યક ક્ષેત્રો સાથે ચિહ્નિત થયેલ છે *

*

*

  1. ડેટા માટે જવાબદાર: મિગ્યુએલ gelંજેલ ગેટóન
  2. ડેટાનો હેતુ: નિયંત્રણ સ્પામ, ટિપ્પણી સંચાલન.
  3. કાયદો: તમારી સંમતિ
  4. ડેટાની વાતચીત: કાયદાકીય જવાબદારી સિવાય ડેટા તૃતીય પક્ષને આપવામાં આવશે નહીં.
  5. ડેટા સ્ટોરેજ: cસેન્ટસ નેટવર્ક્સ (ઇયુ) દ્વારા હોસ્ટ કરેલો ડેટાબેઝ
  6. અધિકાર: કોઈપણ સમયે તમે તમારી માહિતીને મર્યાદિત, પુન recoverપ્રાપ્ત અને કા deleteી શકો છો.