Regular Expression um Links / URLs zu matchen
Folgende Regex matcht aus einem Text die erste URL die vorkommt:
https?://([-\w\.]+)+(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?
Programmiersprachenfreundlich schon \ escaped:
https?://([-\\w\\.]+)+(:\\d+)?(/([\\w/_\\.]*(\\?\\S+)?)?)?
(via)
Tags: coding, regex
This entry was posted
on Donnerstag, November 12th, 2009 at 16:22 and is filed under technik.
You can follow any responses to this entry through the RSS 2.0 feed.
You can leave a response, or trackback from your own site.
November 16th, 2009 at 6:02
Das zweite + ist überflüssig. Außerdem bekommst Du Probleme, wenn eine Domain Umlaute enthält, was ja inzwischen möglich ist. Die Regex müsste wie folgt aussehen
https?://([-\w\.áàăâåäãąāæćĉčċçďđéèĕêěëėęēğĝġģĥħíìĭîïĩįīıĵķĺľļłńňñņŋóòŏôöőõøōœĸŕřŗśŝšşťţŧúùŭûůüűũųūŵýŷÿźžżðþ]+)(:\d+)?(/([\w/_\.]*(\?\S+)?)?)?
November 22nd, 2009 at 15:53
oh danke, ich habs auch nur gegoogelt