Linux和FreeBSD的区别
我们会在很多文档的专业术语中看到FreeBSD
和Linux
,通常情况下我们并不需要了解它们之间的具体关系。但很多时候,如果对这些概念有一个较清楚的把握,还是有助于我们理解相关文档的。下面我们就详细的介绍一下FreeBSD
和Linux
.
我们会在很多文档的专业术语中看到FreeBSD
和Linux
,通常情况下我们并不需要了解它们之间的具体关系。但很多时候,如果对这些概念有一个较清楚的把握,还是有助于我们理解相关文档的。下面我们就详细的介绍一下FreeBSD
和Linux
.
从官网下载已经训练好的中文训练数据,发现效果比较差。这里结合官方教程及自己的实践记录下如何训练Tesseract4.0.0。本文共分成10个部分来进行讲解。
本节我们介绍auto/headers脚本,其主要用于包含类Unix操作系统下的头文件。所关联的脚本文件主要有两个:
auto/cc/conf脚本是作为编译器配置的一个总控脚本,主要完成编译器配置的选择及相关特性的测试。
在nginx源代码auto/cc目录下有很多编译器配置相关的脚本。除了conf脚本
及name脚本
之外,其他的都直接与编译器相关。Nginx的出色跨平台性(Linux、Darwin、Solaris、Win32 等)就有这些脚本的贡献,这些脚本主要有:
在分析编译器配置总控代码之前,我们先来分析auto/cc/name脚本,此脚本主要是完成编译器名称的设置,从而在后续脚本中可以根据编译器名称选择对应的编译器。
我们在分析configure脚本的过程中,发现里面定义了很多工具型的脚本。这里我们统一的来讲述一下nginx工具型脚本。
在configure脚本中,运行完auto/options和auto/init脚本后,接下来就运行auto/sources脚本。这个脚本是为编译做准备的,定义了所有需要编译的modules,以及编译这些modules需要哪些源文件。
我们可以用不同字体(fonts)文本来生成图片,然后再用这些生成的图片来进行tesseract训练。在进行训练的宿主机上必须有这些字体。
在做图片文字提取时,会使用到tesseract开源软件。这里简要介绍tesseract的安装,需要安装两个部分:tesseract引擎、训练好的语言数据。这里我们会分别介绍Linux与Windows平台的安装方法。
在通过源代码安装tesseract,在执行configure命令时一直提示:
Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.
而实际上,我们已经通过源代码的方式成功的安装了Leptonica 1.74.4。最后没办法只能查看configure源代码,发现原来是pkg-config找不到我们安装的leptonica。因此,学习了一下pkg-config及其使用方法,在此做一个记录。
本文我们介绍一下Linux系统中ldconfig命令的使用。
Pillow是Python里的图像处理库(PIL: Python Image Library),提供了广泛的文件格式支持,强大的图像处理能力,主要包括图像存储、图像显示、格式转换以及基本的图像处理操作等。
Python与C/C++可以相互调用。在这一章节里,我们会分别从Linux与Windows平台通过示例的方式介绍它们之间是如何调用的。
在configure中运行完auto/option脚本之后,接着就会运行auto/init脚本。其主要是定义生成的文件名。
本节我们介绍一下Python-OpenCV处理图像的基本操作。
图像的阈值处理一般使得图像的像素值更单一、图像更简单。阈值可以分为全局性质的阈值,也可以分为局部性质的阈值,可以是单阈值的也可以是多阈值的。当然阈值越多是越复杂的。下面将介绍opencv下的三种阈值方法:
灰度化处理
就是将一幅彩色图像转化为灰度图像的过程。彩色图像分为R、G、B三个分量,分别显示出红绿蓝等各种颜色,灰度化就是使彩色的R、G、B分量相等的过程。灰度值最大的像素点比较亮(像素值最大为255,为白色);反之比较暗(像素最小为0,为黑色)。
本文主要讲述在python3.6环境下如何搭建OpenCV开发环境。
接上一章,此文我们来解析auto/options脚本。此脚本主要用来设定配置选项。