Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

archi_webui_database.md 能否细化数据库的部分 #21

Open
JiaLei123 opened this issue Nov 25, 2017 · 4 comments
Open

archi_webui_database.md 能否细化数据库的部分 #21

JiaLei123 opened this issue Nov 25, 2017 · 4 comments
Assignees

Comments

@JiaLei123
Copy link
Collaborator

archi_webui_database.md 能否细化数据库的部分,比如sqlite数据库存储什么数据,mongoDB存储什么数据?sqlite数据库结构是什么样子的?mongoDB结构是什么样子的?

@crownpku
Copy link
Member

这部分文档是@habout632写的,可能要麻烦他细化一下现在的状态。我的了解现在应该就是mongodb的json格式。

@JiaLei123
Copy link
Collaborator Author

我现在有点了解了,我后面来补这个文档。
但是@crownpku 你知不知道那个SQLite的数据库是用来存储什么的吗?webui这里没有看到用SQLite的代码

@crownpku
Copy link
Member

Sqlite那个文件是假的,可以删去。我当初放那个只是为了说明数据库文件的位置。

@crownpku
Copy link
Member

crownpku commented Nov 27, 2017

另外我在想是不是用户自己具体的数据也要放去user instance里面。贴一下之前发的user instance的构想:

希望针对ABC用户的cde任务(如spam email文本分类),其所有配置文件(.config),文本数据(.sqlite/mongodb),模型数据(tensorflow/sklearn/jieba词库)乃至状态数据全都单独放在同一个user_instance下面的位置。这样用户换一台机器的话,只要装好我们的程序,把相应的数据包拷贝过去就能重复和继续之前的工作。

目录命名规则可以类似/chi_annotator/user_instance/ABC_cde_datetime这样。当然用户可以修改数据包名字,但不建议修改保存位置。

Chinese-Annotator/chi_annotator/user_instance/examples/有下面的几个例子如NER, classify等等。用户需要做的仅仅是针对自己的需求,拷贝和修改这里面的config文件;而未来更可以把这一步加去前端的UI里面变得傻瓜化。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants