标注工具doccano,标注后的数据可用于命名实体识别模型和关系抽取模型的训练使用。
创建新环境
1 | conda create --name doccano_env python=3.9 |
进入doccano_env环境
1 | conda activate doccano_env |
安装doccano
1 | pip install doccano |
初始化
只有第一次时需要,之后都不需要
1 | # 初始化,设置用户名密码 |
启动webserver
要提前确保8000端口没有被占用
1 | doccano webserver --port 8000 |
启动任务队列
再打开一个新的anaconda prompt,输入以下代码,启动任务队列
1 | conda activate doccano_env |
登录
1 | # 访问 |
Docker安装Doccano
前提安装docker和docker-compose环境,参考我之前文章。
下载docker-compose编排文文件,上传到服务器目录:点我去下载
比如 /mydata/docker-compose/doccano
新建 .env
文件,参考 .env.example
1 | # platform settings |
启动项目:
1 | docker-compose -f docker-compose.prod.yml --env-file .env up |