Wie heeft er zin om de Google Cache af te stropen???
- V300 register
- Verbannen
-
Minder
Meer
08-03-2007 19:41 #625594
door V300 register
Wie heeft er zin om de Google Cache af te stropen??? is gemaakt door V300 register
via de Google Cache kan nog een hoop informatie van oude topics teruggehaald worden.
wie heeft er zin om dit uit te voeren? Voorlopig is het enige wat er hoeft te gebeuren, het veilig stellen van de tekst info.
de zoekterm op google is:
site:forum.volvo300club.nl
in de resultatenlijst moet je op de onderste regel 'in cache' met rechts klikken en 'openen in nieuw venster'kiezen. kies nu via het menu 'bestand' voor opslaan als, en uit bestandstype het 'webarchief-enkel bestand'
wie heeft er zin om dit uit te voeren? Voorlopig is het enige wat er hoeft te gebeuren, het veilig stellen van de tekst info.
de zoekterm op google is:
site:forum.volvo300club.nl
in de resultatenlijst moet je op de onderste regel 'in cache' met rechts klikken en 'openen in nieuw venster'kiezen. kies nu via het menu 'bestand' voor opslaan als, en uit bestandstype het 'webarchief-enkel bestand'
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
09-03-2007 12:46 #660564
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
Dit was mijn oude voorstel van het tijdelijke forum, alhoewel ik die post niet meer terug kan vinden (????)
Ik wil hier nog steeds wel tijd in steken, destijds kwam er helaas geen antwoord op mijn voorstel.
Belangrijk om te weten is vanaf welke datum posts niet meer in het herstelde forum staan. Zo te zien ergens vanaf juni 2006?
Het idee is dus de data uit de cache pagina's via wat programmeerwerk weer om te zetten is naar een vbulletin database formaat.
Ik wil hier nog steeds wel tijd in steken, destijds kwam er helaas geen antwoord op mijn voorstel.
Belangrijk om te weten is vanaf welke datum posts niet meer in het herstelde forum staan. Zo te zien ergens vanaf juni 2006?
Het idee is dus de data uit de cache pagina's via wat programmeerwerk weer om te zetten is naar een vbulletin database formaat.
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
09-03-2007 12:59 #660566
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
Hoi Bram,
ik heb de topics uit het tijdelijke forum, die ik naar hier toe gehaald had, gewist. maar ik kan me inderdaad herinneren dat een bram (ik kende jouw naam nog niet, maar dat zul jij dus geweest zijn dan
) dat voorgesteld had.
ik heb wel nog twijfels over hoe 'simpel' het is om eea in de vBulletin database te zetten... maar dat is van later zorg. eerst moeten de topics 'gered' worden uit de cache voordat ze overschreven worden met nieuwe.
ik heb de topics uit het tijdelijke forum, die ik naar hier toe gehaald had, gewist. maar ik kan me inderdaad herinneren dat een bram (ik kende jouw naam nog niet, maar dat zul jij dus geweest zijn dan

ik heb wel nog twijfels over hoe 'simpel' het is om eea in de vBulletin database te zetten... maar dat is van later zorg. eerst moeten de topics 'gered' worden uit de cache voordat ze overschreven worden met nieuwe.
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
10-03-2007 19:58 #660652
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
Ik heb eerst een scriptje geschreven dat de zoekopdracht bij google uitvoert, en vervolgens alle resultaatpagina's binnenhaalt (zit een limiet aan van 100 pagina's).
Deze pagina's heb ik binnen. Ik heb nu een scriptje lopen dat alle gecachete pagina's uit die resultaatpagina's vist en ze gaat overhalen. Dit gaat echter wel even duren, omdat google anders doorheeft dat het niet een mens is maar een scriptje. En dan gooien ze de deur dicht. Oplossing is om met willekeurige tussenpozen toch die pagina's over te halen, dat lijkt tot nu toe goed te gaan!
Morgen eens kijken wat er allemaal binnen is komen druppelen!
Deze pagina's heb ik binnen. Ik heb nu een scriptje lopen dat alle gecachete pagina's uit die resultaatpagina's vist en ze gaat overhalen. Dit gaat echter wel even duren, omdat google anders doorheeft dat het niet een mens is maar een scriptje. En dan gooien ze de deur dicht. Oplossing is om met willekeurige tussenpozen toch die pagina's over te halen, dat lijkt tot nu toe goed te gaan!
Morgen eens kijken wat er allemaal binnen is komen druppelen!
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
10-03-2007 22:05 #660661
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
gaaf 
ik had zelf al een stuk of 5 cache pagina's gesaved.. maar dat ging zo traag, dat ik er verder geen tijd meer ingestopt heb.
jouw manier gaat een heel stuk beter zo te horen!!!!

ik had zelf al een stuk of 5 cache pagina's gesaved.. maar dat ging zo traag, dat ik er verder geen tijd meer ingestopt heb.
jouw manier gaat een heel stuk beter zo te horen!!!!
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
10-03-2007 23:29 #660663
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
Ja, met de hand ben ik veel te lui voor, en luie programmeurs zijn goeie programmeurs 
Inmiddels zijn alvast alle gecachete pagina's met 'showthread' in the url binnen, volgens mij zijn dat alle discussie-pagina's. In totaal 539 stuks.
Nu is 'ie bezig met alle pagina's mar 'archief' erin over te halen. Dat zijn er nog eens 400+. Die zullen morgenvroeg ook wel klaar staan!

Inmiddels zijn alvast alle gecachete pagina's met 'showthread' in the url binnen, volgens mij zijn dat alle discussie-pagina's. In totaal 539 stuks.
Nu is 'ie bezig met alle pagina's mar 'archief' erin over te halen. Dat zijn er nog eens 400+. Die zullen morgenvroeg ook wel klaar staan!
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
11-03-2007 00:17 #660664
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
als het goed is zijn de pagina's showthread en archief, duplicaten van elkaar.
zelfde brontekst in de database, ander script om ze uit te lezen.
deze topic is namelijk nu ook te zien via:
forum.volvo300club.nl/archive/index.php/t-1537.html
en de normale weergave is via:
forum.volvo300club.nl/showthread.php?t=1537
zoals je ziet is de t=... hetzelfde nummer. in de database is deze discussie dus opgeslagen onder nummer 1537.
overigens hou ik het best voor mogelijk dat de archief-pagina's er meer zijn dan de gewone. het archief is namelijk speciaal geprogrammeerd om goed te indexeren te zijn voor zoekmachines. geen ingewikkelde layout of css codes etc, gewoon een tabel met een zooi tekst erin. waarschijnlijk zijn die archief pagina's dus 'makkelijker' te importeren dan de showthread (volledige opmaak output) paginas.
over de data:
de berichten die interessant zijn om te saven zijn de berichten die geplaatst zijn in de periode:
van 6 Juli 2006 tot 26 Januari 2007
probleem met de google cache topics is dat de datumweergave op de vorige installatie 'erg uitgebreid' was, m.a.w. zelfs tot een aantal weken na plaatsing werd de plaatsingstijd in dagen en weken weergegeven. je moet dus de plaatsingsdatum dus gaan bepalen adhv de tijd waarop de cache is opgeslagen, plus het aantal dagen/weken dat de post oud was.
zelfde brontekst in de database, ander script om ze uit te lezen.
deze topic is namelijk nu ook te zien via:
forum.volvo300club.nl/archive/index.php/t-1537.html
en de normale weergave is via:
forum.volvo300club.nl/showthread.php?t=1537
zoals je ziet is de t=... hetzelfde nummer. in de database is deze discussie dus opgeslagen onder nummer 1537.
overigens hou ik het best voor mogelijk dat de archief-pagina's er meer zijn dan de gewone. het archief is namelijk speciaal geprogrammeerd om goed te indexeren te zijn voor zoekmachines. geen ingewikkelde layout of css codes etc, gewoon een tabel met een zooi tekst erin. waarschijnlijk zijn die archief pagina's dus 'makkelijker' te importeren dan de showthread (volledige opmaak output) paginas.
over de data:
de berichten die interessant zijn om te saven zijn de berichten die geplaatst zijn in de periode:
van 6 Juli 2006 tot 26 Januari 2007
probleem met de google cache topics is dat de datumweergave op de vorige installatie 'erg uitgebreid' was, m.a.w. zelfs tot een aantal weken na plaatsing werd de plaatsingstijd in dagen en weken weergegeven. je moet dus de plaatsingsdatum dus gaan bepalen adhv de tijd waarop de cache is opgeslagen, plus het aantal dagen/weken dat de post oud was.
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
11-03-2007 00:18 #660665
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
het probleem met de datum weergave is bij de archief pagina's overigens ook niet van toepassing, dus dat zou ook weer schelen.
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
14-03-2007 18:06 #660881
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
Hoi Bram,
heb je nog vorderingen kunnen maken?
heb je nog vorderingen kunnen maken?
Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
- V300 register
- Verbannen
-
Minder
Meer
20-03-2007 00:40 #661526
door V300 register
Beantwoord door V300 register in topic Wie heeft er zin om de Google Cache af te stropen???
beetje stil hier
nog nieuws?

Graag Inloggen of een account aanmaken deelnemen aan het gesprek.
Moderators: Mark Smeets