Liste aller von Google indexierten Seiten

 


scopey
Stammgast

31.07.08
15:38 Uhr
Tach,

gibt es eine Möglichkeit alle Seiten einer Website die von Google indexiert wurde abzurufen?
Beispiel: Ich bräuchte alle 16.300 Seite von diesem Ergebnis.
http://www.google.de/search?hl=de&q=...0&sa=N

Am besten wäre es natürlich, wenn man sich das irgendwie als CSV Datei oder so ausgeben lassen kann. -)
Im Google Webmaster konnte ich leider nichts finden.

Ich könnte die per Hand rausschreiben, jedoch ist das etwas umständlich und Google sagt mir nach ein paar klicks in der Pagination, dass ich ein böser Robot bin und ich nicht mehr weitersuchen darf.

Hat jemand eine Idee, wie man das einfacher lösen kann?
Link zu diesem Beitrag in die Zwischenablage kopieren
Patric
Veteran

31.07.08
17:20 Uhr
Hmmmmm

Vlt. mit der Google API?
Früher gabs SOAP-Search, da hab ich in der Uni mal nen einfaches Java-Programm geschrieben, dass über die Google-API gesucht hat. Man konnte zwar immer nur 10 Suchergebnisse ausgeben lassen, aber mit ner Schleife würde das gehen. Leider hab ich selber keinen SOAP-Key und Google gibt keine mehr raus.

Aber es gibt doch jetzt die „neue“ API für Webapps, vlt kann man da ein PHP Script bauen, welches die Suchergebnisse einfach in ne TXT-Datei schreibt...

Ah da fällt mir aber ein: Google lässt nur (so wars zumindest bei der SOAP-Geschichte) nur 1000 Zugriffe pro Tag und pro Key zu brain

Hmmm, viel blabla, aber keine wirkliche Lösung - sorry -(

-)
Link zu diesem Beitrag in die Zwischenablage kopieren
scopey
Stammgast

31.07.08
18:12 Uhr
puhh.. muss man da echt so einen akt vollziehen?
danke schon mal für den tipp. leider fehlt für sowas zeit und ressourcen.

noch jemand ne andere idee? -)
Link zu diesem Beitrag in die Zwischenablage kopieren
Patric
Veteran

31.07.08
18:24 Uhr
hätte ich nen soap key könnte ich dir das (denke ich *g*) schon machen, dauert halt 2 tage wegen der query-begrenzung, aber ich hab leider keinen (

Was anderes fällt mir jetzt auch net ein planlos
Link zu diesem Beitrag in die Zwischenablage kopieren
scopey
Stammgast

31.07.08
21:44 Uhr
das ist aber nett von dir. -) zwei tage wären auch völlig ok. aber geht ja leider nicht. schimpf
falls ich noch ne andere lösung finde, poste ich es.
Link zu diesem Beitrag in die Zwischenablage kopieren
Erik Hehrmann
Veteran

31.07.08
22:52 Uhr
Ruf doch einfach mal bei Google an! Im Ernst. Fragen kostet doch nix.
Link zu diesem Beitrag in die Zwischenablage kopieren
scopey
Stammgast

31.07.08
23:12 Uhr
Einen Versuch wäre es wert.
Es gibt da ja noch das Gerücht, dass Google es abstraft, wenn man zu viel site:MeineDomain.com eingibt. Das würde wohl nach SEO Manipulation riechen und das mögen sie nicht. Klingt für mich sehr schräg, da sie ja schon sehr offen kommunizieren, wie man möglicherweise besser platziert wird.
Der Anruf wäre nach dem Gerücht ein direkter Eintrag ins Black Book.

Naja, ich glaube da nicht so dran und ich könnte ja immer noch eine andere Domain angeben.
Huiii.. ist das aufregend.. bei Google anrufen.. trippel
Link zu diesem Beitrag in die Zwischenablage kopieren
Patric
Veteran

31.07.08
23:19 Uhr
naja, dann würde ja jedes konkurrenzunternehmen google mit site:gegnerischesunternehmen.com flooden ) glaub das ist eher so ein weiterer seo-mythos D
Link zu diesem Beitrag in die Zwischenablage kopieren
Patric
Veteran

31.07.08
23:51 Uhr
also mit dem free google monitor gehts schon ma nicht (
man kann zwar 10.000 ergebnisse einstellen, er gibt aber nur 1000 aus
Link zu diesem Beitrag in die Zwischenablage kopieren
scopey
Stammgast

01.08.08
00:27 Uhr
ööh. habe mir das toll gerade mal draufgespielt. wirklich verstehen tu ich das aber nicht. planlos
wie bekomme ich denn da ne ausgabe wie z.B. bei google mit site: ?
der spuckt mir irgendwie wohl nur die „konkurrenz“ zu dem keyword aus.
Link zu diesem Beitrag in die Zwischenablage kopieren
Patric
Veteran

01.08.08
00:48 Uhr
ich hab das auch erst vorhin gefunden.
du musst ne „site“ oder „page“ anlegen, da hab ich einfach supertopic.de/forum reingeschrieben, dann kannst du zu der seite nen keyword definieren, dort hab ich site:.... rein und dann ab dafür planlos
Link zu diesem Beitrag in die Zwischenablage kopieren
 
#