Piszę maleńki programik, który po podaniu konkretnego adresu URL pobiera źródło i wyciąga z niego niektóre dane, tj.: linki do podstron.
Problem jednak pojawia się, gdy kod strony nie jest standardowy typu:
- Kod: Zaznacz cały
<a href="http://www.domena.pl/strona.html
a jest na przykład:
- Kod: Zaznacz cały
<a href="#" onclick="closeMenuAndRedirect("/category/5810/
Potrzebuję tak zrobić filtrowanie, żeby zawsze otrzymywać idealny link.
Za radą Cyfrowego Barona zastosowałem takie coś:
URL->Add( Value.SubString(1, b) );
więc dla powyższego problemu próbowałem takie coś:
URL->Add( Value.SubString(1, b) );
Niestety nic to nie daje.
Ma ktoś jakiś pomysł na w miarę uniwersalne wyciąganie linków?
Dodam, że w przypadku dobrze działającego programu liczę nawet na kilka milionów linków, więc potrzebuję dość mocno dopracować filtry.
Idealny format dla mnie by był ( może być z www, ale nie musi ):
- Kod: Zaznacz cały
http://domena.pl/podstrona.rozszerzenie






link wewnętrzny