第一次作业:不限定语言从百度新闻上爬取新闻标题,提交到http://www.pullword.com/baobian/ ,并将负面新闻标题及其网站返回。
第二次作业:利用已有的web服务框架,搭建web服务的服务器端和客户端,服务端要求对客户端提交的结果进行分词,并将结果返回。客户端将语料提交到服务端,接收返回结果。统计多进程多线程下,进程数和线程数对分词速度的影响。
第三次作业:用最短的行数,根据给定的规则,将词语划分。
第四次作业:对有16gb的整数文件进行排序,在4gb内存下进行排序,尽可能提高排序速率。
-
Notifications
You must be signed in to change notification settings - Fork 0
biepenghaomie/penny_liang_exercise
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
No description, website, or topics provided.
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published