spaCy, ọba akwụkwọ nhazi asụsụ

Bọmbụ gbawara agbawa AI kpughere mwepụta nke ọhụụ ọhụrụ nke ọbá akwụkwọ n'efu «SpaCy»Kedu nke mmejuputa iwu nke algọridim nhazi algorithms (NLP). Na omume, enwere ike iji oru ngo mee ihe iji wuo onwe gi, bots, ndokwa ederede, na usoro okwu mkparịta ụka dị iche iche na-ekpebi ihe nkebi ahịrịokwu pụtara.

Ọba akwụkwọ Ezubere iji nye API na-adịgide adịgide Ejikọtaghị ya na algọridim ndị eji ma dị njikere iji ngwaahịa n'ezie. Ọba akwụkwọ na-eji Ọganihu Ọhụrụ na NLP na algọridim kachasị arụ ọrụ dị iji hazie ozi.

Ọ bụrụ na algorithm dị irè karị apụta, a na-enyefe ya ọbá akwụkwọ ahụ, mana mgbanwe a anaghị emetụta API ma ọ bụ ngwa.

Akụkụ nke spaCy ọ bụkwa ihe owuwu ụlọ e mere iji hazie akwụkwọ zuru ezu, n’etughi ụzọ n’usoro ndị bu ụzọ tupu ekewa akwụkwọ ahụ na nkebi ahịrịokwu. A na-enye ndị ụdị ahụ na nsụgharị abụọ: maka oke nrụpụta na oke nkenke.

Isi atụmatụ nke spaCy:

  • Nkwado maka ihe dị ka asụsụ 60.
  • Modelsdị ndị a zụrụ azụ dị maka asụsụ na ngwa dị iche iche.
  • Multitask na-amụ ihe site na iji ndị ntụgharị mbụ azụrụ azụ dị ka BERT (Bidirectional Encoder Renderings of Transformers).
  • Nkwado maka ndị a zụrụ azụ na ntinye okwu.
  • Arụmọrụ dị elu.
  • Njikere iji oru uzi ihe nlere.
  • Asụsụ asụsụ tokenization.
  • Ngwa dị njikere iji jikọta ụlọ ọrụ akpọrọ aha, akara akụkụ nke okwu, ịkekọrịta ederede, nyochaa nkwado dabere na mkpado, kewaa ahịrịokwu, iji akara akụkụ nke okwu, nyocha ihe omimi, ịgha, wdg.
  • Nkwado maka ịgbatị ọrụ yana akụrụngwa na akụrụngwa.
  • Nkwado maka ịmepụta ụdị nke gị dabere na PyTorch, TensorFlow na usoro ndị ọzọ.
  • Ngwa eji arụ ọrụ maka ihe akpọrọ aha ya na ihe onyonyo (NER, Nghọta Aha).
  • Usoro dị mfe nke nkwakọ ngwaahịa na itinye ụdị na ijikwa arụmọrụ.
  • Ezigbo ziri ezi.

Ọba akwụkwọ edere na Python nwere ihe ndị dị na Cython, ndọtị Eke Ọgba nke na-enye ohere ịrụ ọrụ ịkpọ oku na asụsụ C.

Koodu ngo ekesa n'okpuru ikikere MIT. Languagedị asụsụ ahụ dị njikere maka asụsụ 58.

Banyere ụdị ọhụrụ nke spaCy 3.0

The spaCy 3.0 mbipute pụtara maka mmejuputa nke nlereanya ezinụlọ a gughachi azụ n'asụsụ 18 na A zụrụ pipeline 59 na ngụkọta, gụnyere 5 ọhụrụ dabeere na transformer

A na-enye ihe nlereanya ahụ na nsụgharị atọ (16 MB, 41 MB - 20 puku vektọ na 491 MB - 500 puku vektọ) na na-kacha na-arụ ọrụ n'okpuru CPU ibu ma gunyere tok2vec, morphologizer, parser, senter, ner, attribute_ruler, na lemmatizer.

Anyị na-arụ ọrụ na spaCy v3.0 maka ihe karịrị otu afọ, na ihe fọrọ nke nta ka ọ bụrụ afọ abụọ ma ọ bụrụ na ị gụọ ọrụ niile emere na Thinc. Ebumnuche anyị na mwepụta bụ ime ka ọ dị mfe iweta ụdị nke gị na SPACY, ọkachasị ụdị ọgbara ọhụrụ dịka ndị na-agbanwe ọkụ. You nwere ike ide ụdị nke na-eri spaCy akụrụngwa n'ime usoro dịka PyTorch ma ọ bụ TensorFlow, na-eji usoro nhazi ọhụụ ọhụrụ anyị kọwaa ntọala gị niile. Ma ebe ọ bụ na arụmọrụ NLP nke oge a na-enwekarị usoro dị iche iche, enwere usoro ọrụ ọhụụ iji nyere gị aka idozi ọrụ gị.

Mmegharị ndị ọzọ dị mkpa nke na-apụta site na ụdị ọhụrụ ahụ:

  • New workflow maka ụdị ọzụzụ.
  • Usoro nhazi ohuru.
  • Nkwado maka ụdị pipeline na-agbanwe agbanwe, nke kwesịrị ekwesị maka mmụta ọtụtụ.
  • Ikike ijikọ ụdị nke gị site na iji usoro mmụta igwe dị iche iche, dị ka PyTorch, TensorFlow na MXNet.
  • Nkwado oru ngo iji jikwaa usoro niile nke arụmọrụ, site na nhazi tupu itinye ụdị ihe nlereanya.
  • Nkwado maka mwekota na Data Version Control (DVC), Streamlit, Ibu & Biases na Ray nchịkọta.
  • Ihe ohuru ohuru n'ime ya: SentenceRecognizer, Morphologizer, Lemmatizer,
  • AttributeRuler na Ihe ntụgharị.
  • API ohuru iji mepụta ihe nke gi.

N'ikpeazụ, ma ọ bụrụ na ị nwere mmasị ịmatakwu banyere ya nke ohuru a ma obu banyere spaCy, ị nwere ike ịlele nkọwa Na njikọ na-esonụ.


Ọdịnaya nke isiokwu agbaso ụkpụrụ anyị nke ụkpụrụ nduzi. Kpesa mmejọ pịa ebe a.

Bụrụ onye mbụ ịza ajụjụ

Hapu okwu gi

Adreesị email gị agaghị bipụtara. Chọrọ ubi na-akara na *

*

*

  1. Rụ ọrụ maka data: Miguel Ángel Gatón
  2. Nzube nke data: Nchịkwa SPAM, njikwa okwu.
  3. Ikike: Nkwenye gị
  4. Nkwurịta okwu nke data: Agaghị agwa ndị ọzọ data ahụ ma ọ bụghị site na iwu.
  5. Nchekwa data: Ebe nchekwa data nke Occentus Networks (EU) kwadoro
  6. Ikike: Oge obula inwere ike igbachi, weghachite ma hichapụ ihe omuma gi.