tag:blogger.com,1999:blog-2940971822351202057.post1970072007330881850..comments2023-06-08T22:26:59.334+07:00Comments on Python 3: Word2Vec ด้วย Gensim ใน Pythonwannaphonghttp://www.blogger.com/profile/06466348192953662407noreply@blogger.comBlogger6125tag:blogger.com,1999:blog-2940971822351202057.post-38267739515893799782020-05-13T23:07:21.470+07:002020-05-13T23:07:21.470+07:00แก้ไขแล้วครับแก้ไขแล้วครับwannaphonghttps://www.blogger.com/profile/06466348192953662407noreply@blogger.comtag:blogger.com,1999:blog-2940971822351202057.post-39336343745759940542020-05-10T10:04:25.971+07:002020-05-10T10:04:25.971+07:00มีโค้ดของไฟล์ process_wiki.py และ train_word2vec_m...มีโค้ดของไฟล์ process_wiki.py และ train_word2vec_model.py มั้ยคับ ผมหาไม่เจอGotgihttps://www.blogger.com/profile/11647086327201406649noreply@blogger.comtag:blogger.com,1999:blog-2940971822351202057.post-77782105376503550072019-04-06T00:53:14.187+07:002019-04-06T00:53:14.187+07:00space เป็นตัวแปร byte แต่ว่า text เป็น str ค่ะ
ลอ...space เป็นตัวแปร byte แต่ว่า text เป็น str ค่ะ <br />ลองแก้สองที่ space = u" " แล้วก็บรรทัดที่ 27 แก้เป็น output.write((list1) + "\n")Anonymousnoreply@blogger.comtag:blogger.com,1999:blog-2940971822351202057.post-85474513528210319112019-01-30T04:45:34.731+07:002019-01-30T04:45:34.731+07:00ผม run
คำสั่งนี้ python process_wiki.py thwiki-la...ผม run <br />คำสั่งนี้ python process_wiki.py thwiki-latest-pages-articles.xml.bz2 wiki.th.text<br />แล้วขึ้นแบบนี้ครับ<br />File "process_wiki.py", line 27, in <br /> list1=space.join(text)<br />TypeError: sequence item 0: expected a bytes-like object, str found<br />samaihttps://www.blogger.com/profile/08531951558642101272noreply@blogger.comtag:blogger.com,1999:blog-2940971822351202057.post-21491519025775255302019-01-16T15:22:05.020+07:002019-01-16T15:22:05.020+07:00https://github.com/Kyubyong/wordvectors ลองเจ้านี้...https://github.com/Kyubyong/wordvectors ลองเจ้านี้ครับ แล้วทำเป็น .text ออกมา แล้วค่อยเอา .text ที่ตัดทำแล้วมาเข้าของเจ้านี้ต่อAnonymoushttps://www.blogger.com/profile/10153297121367721315noreply@blogger.comtag:blogger.com,1999:blog-2940971822351202057.post-62351757673226343492018-03-29T10:19:49.879+07:002018-03-29T10:19:49.879+07:00ผมเอาโค้ดไปลองแล้วมันมีคำว่า แมว คำว่า โรงพยาบาล แ...ผมเอาโค้ดไปลองแล้วมันมีคำว่า แมว คำว่า โรงพยาบาล แต่มันไม่มีคำหลายคำเลยครับ เช่นคำว่า เป็น <br /><br />print(model.most_similar('เป็น'))<br />Traceback (most recent call last):<br /> File "", line 1, in <br /> File "/usr/local/lib/python3.6/site-packages/gensim/utils.py", line 1398, in new_func1<br /> return func(*args, **kwargs)<br /> File "/usr/local/lib/python3.6/site-packages/gensim/models/base_any2vec.py", line 696, in most_similar<br /> return self.wv.most_similar(positive, negative, topn, restrict_vocab, indexer)<br /> File "/usr/local/lib/python3.6/site-packages/gensim/models/keyedvectors.py", line 365, in most_similar<br /> mean.append(weight * self.word_vec(word, use_norm=True))<br /> File "/usr/local/lib/python3.6/site-packages/gensim/models/keyedvectors.py", line 274, in word_vec<br /> raise KeyError("word '%s' not in vocabulary" % word)<br />KeyError: "word 'เป็น' not in vocabulary"<br /><br />แบบนี้ต้องทำยังไงครับXKYEDhttps://www.blogger.com/profile/14526614980278481067noreply@blogger.com