导航:首页 > IDC知识 > c正则表达式获取域名

c正则表达式获取域名

发布时间:2021-01-25 09:08:50

1、正则表达式匹配域名

匹配完整域名的正则表达式:
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

[a-zA-Z0-9][-a-zA-Z0-9]{0,62}表达的意思如下:
一个完整的域名,由根域名、顶级域名、二级域名、三级域名……构成,每级域名之间用点分开,每级域名由字母、数字和减号构成(第一个字母不能是减号),不区分大小写,长度不超过63。
(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?表达的意思如下:
完整的域名至少包括两个名字(比如google.com,由google和com构成),最后可以有一个表示根域的点(在规范中,最后有一个点的才是完整域名,但一般认为包括两个以上名字的域名也是完整域名,哪怕后面没有点)。

2、c语言正则表达式抓取网站的<title>?

在c语言中 !代表 逻辑运算符非,5 是非0 , 所以 !5 表示 0。 C语言是一门通用计算机编程语言,应用专广泛。属C语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

3、正则表达式如何匹配特定的域名?

如何用正则表达是匹配不含mtalk.google.com、talk.google.com、talkx.l.google.com、talk.l.google.com的其他google域名?


/^[^(mtalk)(talk)(talkx.l)(talk.l)].google.com$/g

4、求助一个正则表达式筛选域名

很高兴能回答你的问题:

(?<=<site>)[^/<]*(?=</|/)

如上使用零宽断言:

匹配<site>后面包含除了【/】和【<】以外的任意字符(不匹配<site>)。

匹配【</】或者【/】的结束位置(不匹配【</】和【/】)

这样,能处理:

<site>www.abc.com</site>


使用grep测试结果:

[^/<]
# 你可以在【^】后面增加任何字符,以保证排除在外,包括空格

5、怎么用正则表达式提取电子邮箱的账户名和域名?

网上找一个邮箱的正则,然后把@前面的和后面的用括号括起来,就可以吧账户名和域名分到分组里了,可以用\1 \2进行引用,或者程序库提供的其他功能引用

6、用正则表达式提取网址中的IP怎样取?

没有对IP地址的有效性做检查:

<html>
<head>
<!--
    将此内容保存为 html 文件,浏览器允许运行脚本进行测试。
-->
<script type="text/javascript">
function check()
{
    var str;
    str = document.getElementById("txtInput").value;
    if (str.match(/(d+.d+.d+.d+:d+)/) != null)
    {
        alert("提取IP端口:" + RegExp.$1);
    }
    else
    {
        alert("没有提取到内容。");
    }
}
</script>
</head>
<body>
    输入:<input type="text" id="txtInput" value="http://10.1.1.1:8080/abcde/cdf" />
    <button type="button" onclick="check()">正则检查</button>
</form>
</body>
</html>

7、用C语言编写一个域名提取的程序,如何选择抓包工具,域名的正则表达式怎么写?

用libpcap这个工具,很强大。

抓包部分在中文手册中有源代码。我就给你讲讲获取域名吧。

首先http包才有域名,并且是你三次握手后第一个包。

包到手后累加14+20+tcp->doff*4后边的信息中有host:*****的消息
14是MAC头 20是ip头 后边那个 是 tcp头 长度(由于tcp头长度不定,但是有标志位的。)
至于怎么提取你自己写吧

与c正则表达式获取域名相关的知识