Text Renderer

Generate text images for training deep learning OCR model (e.g. CRNN).

Modular design. You can easily add Corpus, Effect, Layout.
Support generate lmdb dataset which compatible with PaddleOCR, see Dataset
Support render multi corpus on image with different font, font size or font color. Layout is responsible for the layout between multiple corpora
Generate vertical text
Corpus sampler: helpful to perform character balance

Quick Start

To use text_renderer, you should prepare:

Font file: .ttf or...
Background image
Text: Optional. Depends on the corpus you use.
Character set: Optional. Depends on the corpus you use.

Run following command to generate image using example data:

git clone https://github.com/oh-my-ocr/text_renderer
cd text_renderer
python3 setup.py develop
pip3 install -r docker/requirements.txt
python3 main.py \
    --config example_data/example.py \
    --dataset img \
    --num_processes 2 \
    --log_period 10

The data is generated in the example_data/output directory.

main.py script only has 4 arguments:

config：Python config file path
dataset: Dataset format img/lmdb
num_processes: Number of processes used
log_period: Period of log printing. (0, 100)

All parameters related to the example image generation process are all configured in example.py

Learn more at documentation

Run in Docker

Build image

docker build -f docker/Dockerfile -t text_renderer .

Config file is provided by CONFIG environment. In example.py file, data is generated in example_data/output directory, so we map this directory to the host.

docker run --rm \
-v `pwd`/example_data/docker_output/:/app/example_data/output \
--env CONFIG=/app/example_data/example.py \
--env DATASET=img \
--env NUM_PROCESSES=2 \
--env LOG_PERIOD=10 \
text_renderer

Build docs

cd docs
make html

Open _build/html/index.html

Citing text_renderer

If you use text_renderer in your research, please consider use the following BibTeX entry.

@misc{text_renderer,
  author =       {weiqing.chu},
  title =        {text_renderer},
  howpublished = {\url{https://github.com/oh-my-ocr/text_renderer}},
  year =         {2021}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Text Renderer

Quick Start

Run in Docker

Build docs

Citing text_renderer

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
.github/workflows		.github/workflows
docker		docker
docs		docs
example_data		example_data
image		image
text_renderer		text_renderer
tools		tools
.gitignore		.gitignore
README.md		README.md
main.py		main.py
setup.py		setup.py

mikeshi80/text_renderer

Folders and files

Latest commit

History

Repository files navigation

Text Renderer

Quick Start

Run in Docker

Build docs

Citing text_renderer

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages