HTML auslesen und in RTF speichern

Rund um die LCL und andere Komponenten
Antworten
br_klaus
Beiträge: 244
Registriert: Do 21. Jan 2010, 22:33
OS, Lazarus, FPC: Windows Vista (L 0.9.31 FPC 2.5.1)
CPU-Target: 32Bit
Wohnort: z.z. Brasilien, sonst 82335 Berg-Leoni (südlich von München)

HTML auslesen und in RTF speichern

Beitrag von br_klaus »

Hallo,
hat einer eine Idee, wie ich HTML-Dateien auslesen und den Text (mit Formatierung, so weit das übertragbar ist) in einer RTF-Datei abspeichern kann? Gibt es Komponenten in Lazarus, die sowas schon machen?
Herzlichen Dank.

Benutzeravatar
af0815
Lazarusforum e. V.
Beiträge: 6837
Registriert: So 7. Jan 2007, 10:20
OS, Lazarus, FPC: FPC fixes Lazarus fixes per fpcupdeluxe (win,linux,raspi)
CPU-Target: 32Bit (64Bit)
Wohnort: Burgenland
Kontaktdaten:

Re: HTML auslesen und in RTF speichern

Beitrag von af0815 »

Such mal in der Lazarus ccr, dort hat IMHO Christian schon was geschrieben. Ist zwar nicht 100pro was du willst, zeigt aber die Technik.

Man parst die Seite und setzt die Formatierung in die Zielplattform um. Jetzt kommt es darauf an, wie komplex das ganze arbeiten soll :-)
Blöd kann man ruhig sein, nur zu Helfen muss man sich wissen (oder nachsehen in LazInfos/LazSnippets).

br_klaus
Beiträge: 244
Registriert: Do 21. Jan 2010, 22:33
OS, Lazarus, FPC: Windows Vista (L 0.9.31 FPC 2.5.1)
CPU-Target: 32Bit
Wohnort: z.z. Brasilien, sonst 82335 Berg-Leoni (südlich von München)

Re: HTML auslesen und in RTF speichern

Beitrag von br_klaus »

af0815 hat geschrieben:Such mal in der Lazarus ccr, dort hat IMHO Christian schon was geschrieben. Ist zwar nicht 100pro was du willst, zeigt aber die Technik.
Was bedeutet das genau: IMHO Christian?
Beim Googlen nach Lazarus ccr bin ich auf folgende Seite gelangt: Using the Lazarus-ccr SVN repository (http://wiki.freepascal.org/Using_the_La ... repository" onclick="window.open(this.href);return false;)
Da gibt es ein paar Mal einen Christian, aber nichts mit HTML oder RTF. Wo soll ich also suchen (und nach was speziell)?

Benutzeravatar
af0815
Lazarusforum e. V.
Beiträge: 6837
Registriert: So 7. Jan 2007, 10:20
OS, Lazarus, FPC: FPC fixes Lazarus fixes per fpcupdeluxe (win,linux,raspi)
CPU-Target: 32Bit (64Bit)
Wohnort: Burgenland
Kontaktdaten:

Re: HTML auslesen und in RTF speichern

Beitrag von af0815 »

Lazarus ccr -> Applications -> wikihelp

http://lazarus-ccr.svn.sourceforge.net/ ... /wikihelp/

Das habe ich gemeint, Sorry aber ich sitze derzeit auf Rehab mit nur einem iPad und fast ohne Internet fest :-)

Die Applikation zeigt meines Erachtens wie man von einem Format im Internet in ein anderes Format umsetzen kann.
Blöd kann man ruhig sein, nur zu Helfen muss man sich wissen (oder nachsehen in LazInfos/LazSnippets).

Heinrich Wolf
Beiträge: 323
Registriert: Di 12. Apr 2011, 13:21
OS, Lazarus, FPC: WinXP + VMWare Player mit Fedora14, L 1.1, FPC 2.7.1
CPU-Target: 1core 1,8GHz 32Bit
Wohnort: Fürth
Kontaktdaten:

Re: HTML auslesen und in RTF speichern

Beitrag von Heinrich Wolf »

br_klaus hat geschrieben:Was bedeutet das genau: IMHO Christian?
nach http://dict.leo.org/ : IMHO = "in my humble opinion" = "meiner unbedeutenden Meinung nach"

br_klaus
Beiträge: 244
Registriert: Do 21. Jan 2010, 22:33
OS, Lazarus, FPC: Windows Vista (L 0.9.31 FPC 2.5.1)
CPU-Target: 32Bit
Wohnort: z.z. Brasilien, sonst 82335 Berg-Leoni (südlich von München)

Re: HTML auslesen und in RTF speichern

Beitrag von br_klaus »

af0815 hat geschrieben:Lazarus ccr -> Applications -> wikihelp

http://lazarus-ccr.svn.sourceforge.net/ ... /wikihelp/

Das habe ich gemeint, Sorry aber ich sitze derzeit auf Rehab mit nur einem iPad und fast ohne Internet fest :-)

Die Applikation zeigt meines Erachtens wie man von einem Format im Internet in ein anderes Format umsetzen kann.
Herzlichen Dank. Sieht vielversprechend aus. Werde es mir mal zu Gemüte führen.

Ich hätte da noch eine andere Frage: wie werden in HTML fremdsprachige Zeichen (zB chinesisch, japanisch, russisch o.ä.) ausgegeben? Ich sehe da im HTML-Text auch nur ein Wirrwar von ASCII-Zeichen zwischen 32 und 254. Ist das Unicode? Und wo kann man eine Überstzungstabelle für solche Zeichen finden?
Die möchte ich nämlich auch in RTF abspeichern...

Benutzeravatar
theo
Beiträge: 10904
Registriert: Mo 11. Sep 2006, 19:01

Re: HTML auslesen und in RTF speichern

Beitrag von theo »

br_klaus hat geschrieben: Ich hätte da noch eine andere Frage: wie werden in HTML fremdsprachige Zeichen (zB chinesisch, japanisch, russisch o.ä.) ausgegeben? Ich sehe da im HTML-Text auch nur ein Wirrwar von ASCII-Zeichen zwischen 32 und 254. Ist das Unicode? Und wo kann man eine Überstzungstabelle für solche Zeichen finden?
Die möchte ich nämlich auch in RTF abspeichern...
Heute eigentlich in UTF-8. Was du meinst, ist wahrscheinlich das da:
http://www.w3schools.com/tags/ref_entities.asp" onclick="window.open(this.href);return false;

Antworten