openoffice_automation をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
■概要
インターネットのWebページをPDFでスナップショット撮影しま...
&color(red){*};WebサイトがAjaxだと無理です。静的なページ...
**openOfficeでの自動処理 [#ja14c34d]
openofficをバックグランド常駐させてPDFを作らせる。
まず、裏方として働くopenofficeをインストールします。
yum groupinstall Office/Productivity
yum install openoffice.org-langpack-ja_JP (日本語環境)
yum install xorg-x11-server-Xvfb (仮想フレームバッファー)
っで、これを常駐稼動させるのだが、下記でいいみたい。
export DISPLAY=:1.0
/usr/bin/Xvfb :1 -screen 0 1024x768x8 &
/usr/bin/soffice -invisible -headless -accept="socket,ho...
これを含んだ起動スクリプトを書いて、/etc/init.d/sofficeと...
これでローカルの8100ポートから命を受けて働いてくれます。
次にこのsofficeにデータを投げてPDFに変換指示をしてくれる...
使い方は、
java -jar /opt/Jodconverter/jodconverter/lib/jodconverte...
とするだけである。どうもjodconverterが直に8100ポートと通...
またもっと賢くはGroovyを使うこともできて、CLASSPATHにjodc...
import com.artofsolving.jodconverter.*
import com.artofsolving.jodconverter.openoffice.connecti...
import com.artofsolving.jodconverter.openoffice.converte...
if (args.length < 2) {
println "USAGE: ConvertToPdf.groovy <input-file> <out...
System.exit(255)
}
def input = new File(args[0])
def output = new File(args[1])
def connection = new SocketOpenOfficeConnection(8100)
connection.connect()
def registry = new DefaultDocumentFormatRegistry()
def converter = new OpenOfficeDocumentConverter(connecti...
def pdf = registry.getFormatByFileExtension("pdf")
def pdfOptions = [ 'ReduceImageResolution': true, 'MaxIm...
pdf.setExportOption(DocumentFamily.TEXT, "FilterData", p...
converter.convert(input, output, pdf)
connection.disconnect()
そして、これを
groovy ConvertToPDF.groovy 変換元 PDFファイル
として実行してもOK。この場合、PDF化される際の解像度を指...
次に実践編。
とあるURLの中身をPDF化したいと。。この場合ばず、そのUR...
とあるフォルダを掘って、そこにhtmlファイルと関連ファイル...
wget -nd -k -p -E "http://hogehoge/dataView.aspx?id=2010...
とすると、そのフォルダにhtmlのほか、その画面を構成する画...
この場合、始めのindex.htmlに該当するのが dataView.aspx?id...
そして、ここで大事なのが&color(red){ページサイズ};。html...
<STYLE TYPE="text/css">
<!--
@page { size:landscape }
-->
</STYLE>
こうするとPDFにした際、横長で印刷されます。画像のサイズが...
@page { size: 42cm 29.7cm }
とA3サイズを直接入力します。
このようにしてできたhtmlを先のJodconverterに掛けると思っ...
終了行:
■概要
インターネットのWebページをPDFでスナップショット撮影しま...
&color(red){*};WebサイトがAjaxだと無理です。静的なページ...
**openOfficeでの自動処理 [#ja14c34d]
openofficをバックグランド常駐させてPDFを作らせる。
まず、裏方として働くopenofficeをインストールします。
yum groupinstall Office/Productivity
yum install openoffice.org-langpack-ja_JP (日本語環境)
yum install xorg-x11-server-Xvfb (仮想フレームバッファー)
っで、これを常駐稼動させるのだが、下記でいいみたい。
export DISPLAY=:1.0
/usr/bin/Xvfb :1 -screen 0 1024x768x8 &
/usr/bin/soffice -invisible -headless -accept="socket,ho...
これを含んだ起動スクリプトを書いて、/etc/init.d/sofficeと...
これでローカルの8100ポートから命を受けて働いてくれます。
次にこのsofficeにデータを投げてPDFに変換指示をしてくれる...
使い方は、
java -jar /opt/Jodconverter/jodconverter/lib/jodconverte...
とするだけである。どうもjodconverterが直に8100ポートと通...
またもっと賢くはGroovyを使うこともできて、CLASSPATHにjodc...
import com.artofsolving.jodconverter.*
import com.artofsolving.jodconverter.openoffice.connecti...
import com.artofsolving.jodconverter.openoffice.converte...
if (args.length < 2) {
println "USAGE: ConvertToPdf.groovy <input-file> <out...
System.exit(255)
}
def input = new File(args[0])
def output = new File(args[1])
def connection = new SocketOpenOfficeConnection(8100)
connection.connect()
def registry = new DefaultDocumentFormatRegistry()
def converter = new OpenOfficeDocumentConverter(connecti...
def pdf = registry.getFormatByFileExtension("pdf")
def pdfOptions = [ 'ReduceImageResolution': true, 'MaxIm...
pdf.setExportOption(DocumentFamily.TEXT, "FilterData", p...
converter.convert(input, output, pdf)
connection.disconnect()
そして、これを
groovy ConvertToPDF.groovy 変換元 PDFファイル
として実行してもOK。この場合、PDF化される際の解像度を指...
次に実践編。
とあるURLの中身をPDF化したいと。。この場合ばず、そのUR...
とあるフォルダを掘って、そこにhtmlファイルと関連ファイル...
wget -nd -k -p -E "http://hogehoge/dataView.aspx?id=2010...
とすると、そのフォルダにhtmlのほか、その画面を構成する画...
この場合、始めのindex.htmlに該当するのが dataView.aspx?id...
そして、ここで大事なのが&color(red){ページサイズ};。html...
<STYLE TYPE="text/css">
<!--
@page { size:landscape }
-->
</STYLE>
こうするとPDFにした際、横長で印刷されます。画像のサイズが...
@page { size: 42cm 29.7cm }
とA3サイズを直接入力します。
このようにしてできたhtmlを先のJodconverterに掛けると思っ...
ページ名:
1