python英文分词代码(python 英语分词)

http://www.itjxue.com  2023-03-31 01:13  来源:未知  点击次数: 

python打开txt文件 并且对这个txt文件中的内容进行ngram分词 已有分词代码如下图且运

fname?=?'/d/filename.txt'

with?open(fname)?as?f:

????s?=?f.read()

ng?=NGram(s)

print(ng.table)

怎么是用python 语言 使用结巴分词 呢

Python代码

#encoding=utf-8??

import?jieba??

??

seg_list?=?jieba.cut("我来到北京清华大学",cut_all=True)??

print?"Full?Mode:",?"/?".join(seg_list)?#全模式??

??

seg_list?=?jieba.cut("我来到北京清华大学",cut_all=False)??

print?"Default?Mode:",?"/?".join(seg_list)?#默认模式??

??

seg_list?=?jieba.cut("他来到了网易杭研大厦")??

print?",?".join(seg_list)

输出:?

Full?Mode:?我/?来/?来到/?到/?北/?北京/?京/?清/?清华/?清华大学/?华/?华大/?大/?大学/?学??

??

Default?Mode:?我/?来到/?北京/?清华大学??

??

他,?来到,?了,?网易,?杭研,?大厦????(此处,“杭研”并没有在词典中,但是也被Viterbi算法识别出来了)

PYTHON中如何将一个单词分割

?astring?=?'Hello'

#?最直接的方法

?alist?=?list(astring)

?alist

['H',?'e',?'l',?'l',?'o']

#?列表推导

?alist?=?[ch?for?ch?in?astring]

?alist

['H',?'e',?'l',?'l',?'o']

#?循环法

?alist?=?[]

?for?ch?in?astring:

...?????alist.append(ch)

...?

?alist

['H',?'e',?'l',?'l',?'o']

求问用python实现:编写程序,计算用户输入的英文句子中的词语数量,以及词

s?=?'this?is?a?sentence?sentence?sentence'

list_split?=?s.split('?')

print(list_split)?#?['this',?'is',?'a',?'sentence',?'sentence',?'sentence']

print(len(list_split))

result?=?{}

for?word?in?list_split:

??if?result.get(word,?None):

????result[word]?+=?1

????continue

??result[word]?=?1

print(result)?#?{'is':?1,?'a':?1,?'this':?1,?'sentence':?3}

如何用python和jieba分词,统计词频?

?#!?python3

#?-*-?coding:?utf-8?-*-

import?os,?codecs

import?jieba

from?collections?import?Counter

?

def?get_words(txt):

????seg_list?=?jieba.cut(txt)

????c?=?Counter()

????for?x?in?seg_list:

????????if?len(x)1?and?x?!=?'\r\n':

????????????c[x]?+=?1

????print('常用词频度统计结果')

????for?(k,v)?in?c.most_common(100):

????????print('%s%s?%s??%d'?%?('??'*(5-len(k)),?k,?'*'*int(v/3),?v))

?

if?__name__?==?'__main__':

????with?codecs.open('19d.txt',?'r',?'utf8')?as?f:

????????txt?=?f.read()

????get_words(txt)

论文做实验需要英文分词和单词提取,有啥好python库推荐么

NLTK 的 word_tokenize 就能很方便的实现。

之前打算用C++ 写,后来朋友建议用python,代码简洁得多,果然py强大~难怪国外好多大学CS第一门编程课改成python了,呵呵!

(责任编辑:IT教学网)

更多

推荐其它软件文章