导航:首页 > IDC知识 > 正则获取域名

正则获取域名

发布时间:2020-07-23 08:14:46

1、正则表达式匹配域名

匹配完整域名的正则表达式:
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

[a-zA-Z0-9][-a-zA-Z0-9]{0,62}表达的意思如下:
一个完整的域名,由根域名、顶级域名、二级域名、三级域名……构成,每级域名之间用点分开,每级域名由字母、数字和减号构成(第一个字母不能是减号),不区分大小写,长度不超过63。
(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?表达的意思如下:
完整的域名至少包括两个名字(比如google.com,由google和com构成),最后可以有一个表示根域的点(在规范中,最后有一个点的才是完整域名,但一般认为包括两个以上名字的域名也是完整域名,哪怕后面没有点)。

2、如何用正则获取URL中的主域名

\"/^ http:\\/\\/[a-zA-Z]+\\.[\\w]+\\.[a-zA-Z]+$/\"不全面,貌似只能匹配二级域名如果顶级域名 http://163.com 呢?shooting 发表于 2009-6-4 21:40[i][/url][/b]也一样可以用的[]符号本身就是可选的稍微修改一下*+这些符号就可以了

3、javascript获取域名的后缀的正则表达式(顶级域名)

public string GetUrlDomainName(string url)
{
//获取域名的正则表达式
string p = @"http://[^\.]*\.(?<domain>[^/|?]*)";
Regex reg = new Regex(p, RegexOptions.IgnoreCase);//不区分大小写匹配
//正则表达式匹配结果
Match m = reg.Match(url);
//返回匹配结果值
return m.Groups["domain"].Value;
}

4、求一个匹配域名采集的正则表达式,比如 www.yuming.com 我要匹配页面中所有包含域名 :yuming 的链接

string pattern="(http://){0,1}(/w/d)*.yuming.(com|cn|net)";
解析:(http://){0,1}指示无论域名出现时是否带有http://字样都要进行匹配。
(/w/d)*:指示无论出现二级域名与否,只要带有yuming字样都要进行匹配
yuming指你要采集的域名,你自行替换吧。
(com|net|cn):要取域名的后缀,根据需要,你可以自行添加或删减。
这个表达式相比较来说比做蜘蛛程序的表达式容易写,你应当研究一下。做.net采集,不会正则无疑是瘸了条腿。

5、帮写个使用正则获取域名,js

var str='http://.baidu.com/q?ct=23214';
var re = /http:\/\/([^\/]+)\//i;
var h = str.match(re);
alert(h[1]);

6、如何获得顶级域名正则

需要从URL中提取主域名,从网上找了很多。大部分都只是从http://查询域名/ 对于http://youa.网络.com/,http://www.网络.com/ http://网络.com/等就不能提取网络.com这样的主域名。

7、如何编写一个从已知网址中获取根域名的正则表达式

.*:\/\/.*?\/

8、正则表达式 取根域名(请看清楚,不是验证,是要取值)

如图,不带该需求的哦

9、求助一个正则表达式筛选域名

很高兴能回答你的问题:

(?<=<site>)[^/<]*(?=</|/)

如上使用零宽断言:

匹配<site>后面包含除了【/】和【<】以外的任意字符(不匹配<site>)。

匹配【</】或者【/】的结束位置(不匹配【</】和【/】)

这样,能处理:

<site>www.abc.com</site>


使用grep测试结果:

[^/<]
# 你可以在【^】后面增加任何字符,以保证排除在外,包括空格

10、正则表达式如何匹配特定的域名?

如何用正则表达是匹配不含mtalk.google.com、talk.google.com、talkx.l.google.com、talk.l.google.com的其他google域名?


/^[^(mtalk)(talk)(talkx.l)(talk.l)].google.com$/g

与正则获取域名相关的知识