- Mitglied seit
- 7 Nov 2009
- Beiträge
- 41
- Punkte für Reaktionen
- 0
- Punkte
- 0
Hi Rob,
nachstehend kleiner Beitrag von mir für Dein Programm zur Rückwärtssuche für Norwegen. Ich habe den Code etwas optimiert bzw. die Suche etwas ausgebaut. Vielleicht magst Du die Erweiterung auch für das nächste Upgrade aufnehmen? Ansonsten kann sie ja sicher auch jeder selbst in der reverselookup.xml implementieren, der mag / Bedarf hat. Die Suchmaschinen-Datenbanken sind übrigens nicht redundant, d.h. es gibt tatsächlich Nummern, die jeweils nur in einer Suchmaschine gefunden werden und es gibt keine, die alle Nummern kennt.
Gibt es eigentlich eine Möglichkeit, die richtigen Regex-Expressionen programmgestützt ermitteln zu lassen? Das manuelle Gepfriemele ist schon sehr aufwendig, wenn auch die Qualität sicher etwas besser wird.
Hast Du die Rückwärtssuchen in der reverselookup alle manuell selbst entwickelt???
Problem ist zudem sicher auch, dass das Format der Anbieter immer mal wieder geändert wird...
Nochmals Danke und viele Grüße!
pyramus
==============================================
=== Kopieren und in den Abschnitt <country code="+47"> einfügen ===
==============================================
nachstehend kleiner Beitrag von mir für Dein Programm zur Rückwärtssuche für Norwegen. Ich habe den Code etwas optimiert bzw. die Suche etwas ausgebaut. Vielleicht magst Du die Erweiterung auch für das nächste Upgrade aufnehmen? Ansonsten kann sie ja sicher auch jeder selbst in der reverselookup.xml implementieren, der mag / Bedarf hat. Die Suchmaschinen-Datenbanken sind übrigens nicht redundant, d.h. es gibt tatsächlich Nummern, die jeweils nur in einer Suchmaschine gefunden werden und es gibt keine, die alle Nummern kennt.
Gibt es eigentlich eine Möglichkeit, die richtigen Regex-Expressionen programmgestützt ermitteln zu lassen? Das manuelle Gepfriemele ist schon sehr aufwendig, wenn auch die Qualität sicher etwas besser wird.
Hast Du die Rückwärtssuchen in der reverselookup alle manuell selbst entwickelt???
Problem ist zudem sicher auch, dass das Format der Anbieter immer mal wieder geändert wird...
Nochmals Danke und viele Grüße!
pyramus
==============================================
=== Kopieren und in den Abschnitt <country code="+47"> einfügen ===
==============================================
Code:
<country code="+47">
<website name="gulesider.no" url="http://www.gulesider.no/gs/categoryList.c?q=$NUMBER" prefix="" numLines="7">
<entry>
<name swapFirstAndLastName="true"><h2 class="name">\s*<a href="[^"]*"\s*title="[^"]*">\s*([^<]*)\s*<span>\s*[^<]*</span>\s*</a>\s*</h2></name>
<street><div class="address">\s*<p>([^,]*),\s*[^\s]*\s[^<]*</p>\s*</div></street>
<city>\s*<div class="address">\s*<p>[^,]*,\s*[^\s]*\s([^<]*)</p>\s*</div>|\s*<div class="address">\s*<p>[\d]*\s*([^<]*)</p></city>
<zipcode><div class="address">\s*<p>[^,]*,\s*([\d]*)\s[^<]*</p>\s*</div>|<div class="address">\s*<p>([\d]*)\s[^<]*</p>\s*</div></zipcode>
</entry>
</website>
<website name="nettkatalogen.no" url="http://www.nettkatalogen.no/default.asp?search=$NUMBER&x=36&y=15&cmd=psok" prefix="">
<entry>
<name swapFirstAndLastName="true">class='privatsok_oppforing_navn'[\s]valign=top><b>([^<]*)</b></name>
<street>class='privat_adresse_link'>([^<]*)</a></street>
<city></a>, \d* ([^<]*)</span></td></tr></city>
<zipcode></a>, (\d*) [^<]*</span></td></tr></zipcode>
</entry>
</website>
<website name="nettkatalogen.no/bransjelist" url="http://www.nettkatalogen.no/bransjelist/$NUMBER/1.htm" prefix="">
<entry>
<name>class='firmasok_oppforing_link'><b>([^<]*)</b></name>
<street><div class='firmasok_oppforing_adresse'>([^,^<]*).*</div></street>
<city><div class='firmasok_oppforing_adresse'>[^,]*,[\s][\d]*[\s]([^<]*)</div></city>
<zipcode>'firmasok_oppforing_adresse'>[^,]*,[\s](\d*)[\s]</zipcode>
</entry>
</website>
<website name="gul.no" url="http://gul.no/?q=$NUMBER&PageView=YellowResult" prefix="">
<entry>
<name swapFirstAndLastName="true"><a id="ancCompanyName"[^>]*>([^<]*)</a></name>
<street>class="sr_showaddress">([^<]*)<</street>
<city>class="sr_showaddress">[^>]*>[\d]*([^<]*)<</city>
<zipcode>class="sr_showaddress">[^>]*>([\d]*)[\s]</zipcode>
</entry>
</website>
</country>
Zuletzt bearbeitet von einem Moderator: