1、求一个匹配域名采集的正则表达式,比如 www.yuming.com 我要匹配页面中所有包含域名 :yuming 的链接
string pattern="(http://){0,1}(/w/d)*.yuming.(com|cn|net)";
解析:(http://){0,1}指示无论域名出现时是否带有http://字样都要进行匹配。
(/w/d)*:指示无论出现二级域名与否,只要带有yuming字样都要进行匹配
yuming指你要采集的域名,你自行替换吧。
(com|net|cn):要取域名的后缀,根据需要,你可以自行添加或删减。
这个表达式相比较来说比做蜘蛛程序的表达式容易写,你应当研究一下。做.net采集,不会正则无疑是瘸了条腿。
2、求一个域名的正则表达式!
^(([0-9a-z]+-[0-9a-z]+)+\.|([0-9a-z]+)\.)+[a-z]{2,8}$
3、oracle 如何使用正则表达式匹配出一级域名
匹配完整域名的正则表达式:
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}表达的意思如下:
一个完整的域名,由根内域名、顶级域名、二级域名、三容级域名……构成,每级域名之间用点分开,每级域名由字母、数字和减号构成(第一个字母不能是减号),不区分大小写,长度不超过63。
(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?表达的意思如下:
完整的域名至少包括两个名字(比如google.com,由google和com构成),最后可以有一个表示根域的点(在规范中,最后有一个点的才是完整域名,但一般认为包括两个以上名字的域名也是完整域名,哪怕后面没有点)。
4、正则表达式匹配域名
匹配完整域名的正则表达式:
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}表达的意思如下:
一个完整的域名,由根域名、顶级域名、二级域名、三级域名……构成,每级域名之间用点分开,每级域名由字母、数字和减号构成(第一个字母不能是减号),不区分大小写,长度不超过63。
(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?表达的意思如下:
完整的域名至少包括两个名字(比如google.com,由google和com构成),最后可以有一个表示根域的点(在规范中,最后有一个点的才是完整域名,但一般认为包括两个以上名字的域名也是完整域名,哪怕后面没有点)。
5、求一个url_rewrite的正则表达式(用于二级域名跳转)
正则:
/mail\.(\w+\.\w{3})/is
替换为:
www.\1:6080
用php程序测试专:
$str = 'mail.zhoubish.com';
$pattern = '/mail\.(\w+\.\w{3})/is';
$str = preg_replace($pattern, 'www.\1:6080', $str);
echo $str;// 你想要的属
6、谁能帮我写一个只匹配顶级域名的正则表达式
以下我给出的代码。不完善之处,多多交流。
把以下代码放到一个后缀名为html文件中,运回行即可答。
<html>
用正则表达式对顶级域名进行验证:
<form>
<input type="text" name=domin size="80" value="http://www.mifeng.cc">
<input type="button" value="验证" onclick="alert(verify(this.form.domin.value))">
</form>
</html>
<script language="javascript" type="text/javascript">
//入口参数:域名字符串
//出口参数:true|false
function verify(str)
{
var myReg=new RegExp("^(http://(\\w+\\.)+?[a-zA-Z]{2,3})$");
return myReg.test(str);
}
</script>
7、求助一个正则表达式筛选域名
很高兴能回答你的问题:
如上使用零宽断言:
匹配<site>后面包含除了【/】和【<】以外的任意字符(不匹配<site>)。
匹配【</】或者【/】的结束位置(不匹配【</】和【/】)
这样,能处理:
<site>www.abc.com</site>
使用grep测试结果:
8、中文域名的验证正则表达式
/^[A-Za-z0-9_\u4E00-\u9FA5]{1,20}([\.\-][A-Za-z0-9_\u4E00-\u9FA5]{1,20})*$/
试试这样吧,你用的php程序哟?自己写几个超出的和符合的验证一下就知道了。+表示“1个或者多个”,改成{1,20}就可以了
补充:=============================================
你的意思是有
www.我是中文域名123im.com这种混合形式而如果其中不出现中文的那段就可以超过20的么?那可以改一改:
/^(?:[\w_]+|[A-Za-z0-9_\u4E00-\u9FA5]{1,20})([\.\-][A-Za-z0-9_\u4E00-\u9FA5]{1,20}|[\w_]+)*$/
没试过,你可以用你那边样本域名测试下看
9、英文URL匹配.com域名的正则表达式怎么写最优
匹配完整域名的正则表达式:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?[a-zA-Z0-9][-a-zA-Z0-9]{0,62}表达的意思如下:一个完整的域名,由根域名、顶级域名、二级域名、三级域名……构成,每级域名之间用点分开,每