O listă completă a sindicatelor în română

Pagina SHRA personale, blog-ul frilensera, dezvoltator web în PHP. Aici am împărtăși experiențele și gândurile mele, petrec experimente pe oameni, aduna dovezi intangibile ale propriei sale prostie. Folosind exemplul de cod de pe acest site, acceptați întreaga responsabilitate pentru consecințele utilizării lor, inclusiv sănătatea mintală și interesele părților terțe.







Baza de pe partea discursului de date „sindicatelor“ este derivat dintr-o bază comună de cuvinte morfologiei limbii române. pentru că Sindicatele nu au nici o, sau morfologie, veți obține un singur tabel cu o listă de cuvinte.

Cuvinte-rusă-conjunctions.sql.gz - uniuni conjuncții de masă de bază.

Atenție! Script-ul conține «DROP TABLE dacă există».







Tabel Descriere conjuncțiilor

Baza de date conține 322 Union. Împreună cu conjuncțiile simple, cum ar fi „și“, „dar“, aici veți găsi un asociații complexe, cum ar fi „datorită faptului că“ și „astfel încât să se“. Ie acestea includ o secvență de mai multe cuvinte și chiar și punctuația.

  • IID, int - cheie surogat
  • cuvânt, varchar [100] - formă cuvânt.
  • forme de cod cuvânt - cod int.

Date predicatives Baza generate de morfologia de bază eșantion de cuvinte în limba română. Noi în școală nu a învățat această parte de vorbire. Cred că lingviștii prea greu să-l distinge de predicatives interjecții, apoi de la adverbe. script-ul SQL este disponibil pe GitHub. Pass.

S-au găsit în site-ul dicționare speakrus.ru. Toate mare, dar de ce, care este distribuit sub formă de fișiere text. De exemplu, dicționar morfologică a formelor 4159394 cuvânt pentru 142,792 leme - un footcloth de text 220 megaocteți! Un astfel de fișier este dificil de a face ceva.