在Linux上如何将下文本文件的存储格式转换成PDF格式

pdftotext —— Linux/Unix中将PDF文件转化为Text文本格式的利器
时间: 12:46:55
&&&& 阅读:434
&&&& 评论:
&&&& 收藏:0
标签:&&&&&&&&&&&&&&&&&&&&&&&&&&&安装 pdftotext&到 RedHat / RHEL / Fedora / CentOS / Ubuntu
在不同的Linux分发版本中使用poppler-utils包安装pdftotext(CentOS):
# yum install poppler-utils
或者在Debian / Ubuntu中使用如下指令:
$ sudo apt-get install poppler-utils
pdftotext 使用语法
pdftotext {PDF-file} {text-file}
如何将pdf转化为text?
将php-manual.pdf 转化为 php-manual.txt:
$ pdftotext php-manual.pdf php-manual.txt
只转化前 5 页和后 10 页:
$ pdftotext -f 5 -l 10 php-manual.pdf php-manual.txt
转化加密过的pdf文件(&owner password ):
$ pdftotext -opw ‘password‘ php-manual.pdf php-manual.txt
转化加密过的pdf文件(&user password ):
$ pdftotext -upw ‘password‘ php-manual.pdf php-manual.txt
Sets the end-of-line convention to use for text output. You can set it to unix, dos or mac. For UNIX / Linux oses, enter:
$ pdftotext -eol unix php-manual.pdf php-manual.txt原作: http://www.icultivator.com/p/8744.html标签:&&&&&&&&&&&&&&&&&&&&&&&&&&&原文:http://www.cnblogs.com/appsolution/p/4281161.html
教程昨日排行
&&国之画&&&& &&&&&&
&& &&&&&&&&&&&&&&
鲁ICP备号-4
打开技术之扣,分享程序人生!拒绝访问 | www.ggdoc.com | 百度云加速
请打开cookies.
此网站 (www.ggdoc.com) 的管理员禁止了您的访问。原因是您的访问包含了非浏览器特征(da543ef-ua98).
重新安装浏览器,或使用别的浏览器404 Not Found
404 Not Found&nbsp>&nbsp
&nbsp>&nbsp
&nbsp>&nbsp
Linux 有问必答:在Linux上如何将文本文件转换成PDF格式
摘要:提问:我想要将一个纯文本文件转换成PDF文档。在Linux命令行下是否有一个简单的方法将文本文件转换成PDF文件?当你有一大堆文本文件要维护的时候,把它们转换成PDF文档会好一些。比如,PDF更适合打印,因为PDF文档有预定义布局。除此之外,还可以减少文档被意外修改的风险。要将文本文件转换成PDF格式,你要按照下面的两步。准备工作首先你要安装两个需要的包。在Debian、Ubuntu或者LinuxMint上:$sudoapt-getinstallenscriptghostsc
提问: 我想要将一个纯文本文件转换成PDF文档。在Linux命令行下是否有一个简单的方法将文本文件转换成PDF文件?
当你有一大堆文本文件要维护的时候,把它们转换成PDF文档会好一些。比如,PDF更适合打印,因为PDF文档有预定义布局。除此之外,还可以减少文档被意外修改的风险。
要将文本文件转换成PDF格式,你要按照下面的两步。
准备工作首先你要安装两个需要的包。
在 Debian、Ubuntu 或者 Linux Mint上:
$ sudo apt-get install enscript ghostscript
在 Fedora、CentOS/RHEL上:
$ sudo yum install enscript ghostscript
在 Arch Linux上:
$ sudo pacman -S enscript ghostscript
将文本文件转换成PDF格式准备工作完成之后,按照下面的两步从文本文件生成一个PDF文件
首先,使用enscript命令行工具将文本文件转换成postscript格式。
$ enscript -p output.ps input.txt
最后将postscript格式文件转换成PDF文件。
$ ps2pdf output.ps output.pdf
via: http://ask.xmodulo.com/convert-text-to-pdf-linux.html
本文由 LCTT 原创翻译,Linux中国 荣誉推出
以上是的内容,更多
的内容,请您使用右上方搜索功能获取相关信息。
若你要投稿、删除文章请联系邮箱:zixun-group@service.aliyun.com,工作人员会在五个工作日内给你回复。
云服务器 ECS
可弹性伸缩、安全稳定、简单易用
&40.8元/月起
预测未发生的攻击
&24元/月起
邮箱低至5折
推荐购买再奖现金,最高25%
&200元/3月起
你可能还喜欢
你可能感兴趣
阿里云教程中心为您免费提供
Linux 有问必答:在Linux上如何将文本文件转换成PDF格式相关信息,包括
的信息,所有Linux 有问必答:在Linux上如何将文本文件转换成PDF格式相关内容均不代表阿里云的意见!投稿删除文章请联系邮箱:zixun-group@service.aliyun.com,工作人员会在五个工作日内答复
售前咨询热线
支持与服务
资源和社区
关注阿里云
Internationaljodconverter纯文本文件转为pdf时中文问题解决方案
本文转载:
jodconverter转换ms文件都没有出现中文问题,但是在转换最简单的纯文本文件时却出现中文问题。我开始时找了cpdetecter来探测纯文本文件的编码格式,但是对一些文件的编码格式还是探测不对,所以想通过它探测到文本文件的编码格式,再将它转为UTF-8的方式来实现文本的统一编码方式(演示代码见下面)是行不通的:
import java.io.FileInputS
import java.io.FileOutputS
import java.io.InputStreamR
import java.io.OutputStreamW
public class changeCharacterFormat {
public static void main(String[] args) throws Exception{
InputStreamReader in = new InputStreamReader(
new FileInputStream("D:\\test\\File\\新建 文本文档 (2).txt"),"GB2312");
OutputStreamWriter out = new OutputStreamWriter(
new FileOutputStream("D:\\test\\File\\新建 文本文档 (2)8.txt"),"utf-8");
char[] cbuf = new char[1024];
while((n=in.read(cbuf))!=-1){
out.write(cbuf, 0, n);
in.close();
out.close();
import java.io.FileInputS
import java.io.FileOutputS
import java.io.InputStreamR
import java.io.OutputStreamW
public class changeCharacterFormat {
public static void main(String[] args) throws Exception{
InputStreamReader in = new InputStreamReader(
new FileInputStream("D:\\test\\File\\新建 文本文档 (2).txt"),"GB2312");//按原文件的编码方式进行读取文件信息
OutputStreamWriter out = new OutputStreamWriter(
new FileOutputStream("D:\\test\\File\\新建 文本文档 (2)8.txt"),"utf-8");//转换为自己想要的编码格
char[] cbuf = new char[1024];
while((n=in.read(cbuf))!=-1){
out.write(cbuf, 0, n);
in.close();
out.close();
如是就试着将纯文本文件(如*.java,*.c,*.log,*.xml,*.mxml,*.jsp,*asp,*.js等等)的后缀改为.txt再打由openoffice打印成pdf,它是可以打印,但是对于有中文的文件,它就会出现乱码。后来我将它们改为*.odt的后缀后就可以正确地打印成pdf,显示出正常的中文。这里其实是这样的,我将它们改为.odt后缀后,那么再用jodconverter来打印时,它就会调用openoffice来打印,那么就相当于它用openoffice打开它的odt格式的文件,再点击打印成pdf;因为它对*.odt文件支持中文,所以它打开它时,中文是正确的,其实它在读这个非odt的纯文本文件时,它就能识别出它的编码格式,所以就不用我们再去找那个原文件的编码格式,再进行转换,我们可以直接打印。所以关键还是理解jodconverter的打印原理,它不过是对openoffice的打印接口的调用,所以我们若将如*.jsp等文本改后缀名为*.txt,因为*.txt不是由openoffice直接产生的文本格式,所以对它的支持力度就没有将这些文件改后缀名为*.odt的好,因此将其它非odt的纯文本文件改名为odt文本文件时,它打印出pdf时能正确显示中文,而改名为txt后缀时,出现乱码的主要原因。
没有更多推荐了,
加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!}

我要回帖

更多关于 linux 文本文件格式 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信