Teil einer fremden Website auslesen

Fragen zum Thema HTML, JavaScript, PHP
Antworten
nehaali
Beiträge: 1
Registriert: Di Dez 17, 2013 6:26 am

Teil einer fremden Website auslesen

Beitrag von nehaali » Di Dez 17, 2013 6:30 am

Ist das machbar? Ich möchte auf meiner Webseite einen Verweis zu der bestimmten Stelle im Quellcode der Radio-Webseite haben, der immer den aktuellen Titel etc. beinhaltet. Dann sollen alle Titel in eigene Listen zur "Verwaltung" gespeichert werden. Problem dabei ist, dass die "Quell-Webseite" ja dynamisch ist und auch automatisch aktualisiert wird. Kann man also besagten Verweis immer auf den aktuellen Titel lenken?
neha

Benutzeravatar
Xin
nur zu Besuch hier
Beiträge: 8486
Registriert: Fr Jul 04, 2008 11:10 pm
Wohnort: /home/xin
Kontaktdaten:

Re: Teil einer fremden Website auslesen

Beitrag von Xin » Di Dez 17, 2013 10:17 am

Moin nehaali,

Bitte für neue Fragen ein neues Thema, dann muss keiner die Themen wieder trennen und sich einen Betreff dafür ausdenken, ok?
nehaali hat geschrieben:Ist das machbar? Ich möchte auf meiner Webseite einen Verweis zu der bestimmten Stelle im Quellcode der Radio-Webseite haben, der immer den aktuellen Titel etc. beinhaltet.
(Fast) Alles ist machbar, wenn man nur genug rumpfuscht. :->

Du kannst die Website auslesen, dir den passenden Teil raussuchen und die Daten anschließend auf in Deine Webseite einbauen. Das geht schon - entweder Serverseitig oder per JavaScript.
Rechtlich könnte das aber eventuell Missfallen verursachen, wenn der Radiobetreibe keine Lust hat Traffic zu verbuchen, obwohl Du seine Werbung ausblendest.
nehaali hat geschrieben:Dann sollen alle Titel in eigene Listen zur "Verwaltung" gespeichert werden. Problem dabei ist, dass die "Quell-Webseite" ja dynamisch ist und auch automatisch aktualisiert wird. Kann man also besagten Verweis immer auf den aktuellen Titel lenken?
Aktuell heißt "jetzt in genau diesem Moment". Entsprechend müsstest Du auch auslesen, wie lange der Titel dauert um damit zu erfahren, wann Du den nächsten Titel abfragen musst.

Wer soll das überhaupt verwalten!? Eine Website kann keine persistente Liste führen (jemand anderer oder Du selbst nach einem Reload hättest keinen Zugriff darauf). Der Server hingegen weiß nicht, wann Dich irgendwas interessiert - er müsste durchgehend abfragen, was wieder Ärger mit dem Radiobetreiber verursachen könnte.
Merke: Wer Ordnung hellt ist nicht zwangsläufig eine Leuchte.

Ich beantworte keine generellen Programmierfragen per PN oder Mail. Dafür ist das Forum da.

Benutzeravatar
darksider3
Beiträge: 347
Registriert: Fr Sep 14, 2012 6:26 pm
Wohnort: /dev/sda1
Kontaktdaten:

Re: Teil einer fremden Website auslesen

Beitrag von darksider3 » Di Dez 17, 2013 1:00 pm

Moin,
nehaali hat geschrieben:Ist das machbar? Ich möchte auf meiner Webseite einen Verweis zu der bestimmten Stelle im Quellcode der Radio-Webseite haben, der immer den aktuellen Titel etc. beinhaltet. Dann sollen alle Titel in eigene Listen zur "Verwaltung" gespeichert werden. Problem dabei ist, dass die "Quell-Webseite" ja dynamisch ist und auch automatisch aktualisiert wird. Kann man also besagten Verweis immer auf den aktuellen Titel lenken?
Natürlich machbar. Kennst Du dich mit Regex aus? Damit wäre das eine Recht simple Geschichte. Wenn Du einen Server zu Verfügung hast, könnte man das auch per sed machen, und dann Minütlich als Cronjob laufen lassen, dann die Ergebnisse per Bash/Shellskript in die DB eintragen und per PHP/Andere Sprache einfach wieder Abrufen.

Mit Javascript sollte das auch gehen. Soweit ich weiß ist es mittlerweile mit JQuery möglich durch RegEx oder Dom-Manipulation soetwas zu filtern und wieder Dynamisch auszugeben, ohne alles Zwischenzuspeichern. Der nachteil hier liegt darin, dass Du den Clienten dazu zwingen musst, die Seite runterzuladen um etwas auszulesen.

Ansonsten... wie Xin bereits sagte. Durch gefrickel wirds meist dann etwas. Ob mit mehr oder Weniger aufwand sieht man erst später...
effizienz ist, wenn ich ein loch bohre und hinterher mein nachbar auch ein bild aufhängen kann... ^^
Meine Homepage und der Microblog von mir :)
Live Life dont let Life Live You!
Am meisten Aktiv in Webentwicklung und PHP im Wiki

Maxl
Beiträge: 6
Registriert: Mi Okt 29, 2014 3:26 pm

Re: Teil einer fremden Website auslesen

Beitrag von Maxl » Mi Okt 29, 2014 3:34 pm

Das ist machbar, kann dir aber Probleme mit google machen wegen "duplicate content"
Du hast da 2 möglichkeiten:
1. eine iFrame script hochfahren die die daten von der Target website ausliest und auf deine Website anzeigt (auf Wordpress gibt es ein sehr einfaches plugin dafür)
2. Die Daten von der Website mithilfe eines scrappers in Form von HTML holen und in eine div area einbauen.

Wie gesagt, ist machbar, aber falls du den Ur-Content nicht auch automatisch abwandelst wirst du Probleme mit Google haben.

Am besten den Output mit Copyscape.com testen ;)

riget
Beiträge: 1
Registriert: Fr Jun 02, 2017 9:26 am
Wohnort: Wien
Kontaktdaten:

Re: Teil einer fremden Website auslesen

Beitrag von riget » Fr Jun 02, 2017 9:51 am

Um Teile einer Website einfach rauszuholen kann man PHP Simple HTML DOM verwenden (http://simplehtmldom.sourceforge.net/)

nouseforname
Beiträge: 236
Registriert: Do Feb 10, 2011 6:31 pm

Re: Teil einer fremden Website auslesen

Beitrag von nouseforname » Sa Jun 03, 2017 5:56 pm

Wenn es Dir nur um das Sammeln der Titelinformation geht, würde ich sowas wohl Serverseitig in einem Script laufen lassen. Das auslesen geht ganz einfach mit zB Javascript wenn Du nur bestimmte Infos Filtern willst.

Willst Du eine ganze Webseite Filtern und darstellen gibts für PHP einige Möglichkeiten....


Bei allem immer der Nachteil dass man die Abfragen nicht zu häufig triggern sollte, sonst kann das Probleme geben.

Antworten