導航:首頁 > IDC知識 > c正則表達式獲取域名

c正則表達式獲取域名

發布時間:2021-01-25 09:08:50

1、正則表達式匹配域名

匹配完整域名的正則表達式:
[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

[a-zA-Z0-9][-a-zA-Z0-9]{0,62}表達的意思如下:
一個完整的域名,由根域名、頂級域名、二級域名、三級域名……構成,每級域名之間用點分開,每級域名由字母、數字和減號構成(第一個字母不能是減號),不區分大小寫,長度不超過63。
(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?表達的意思如下:
完整的域名至少包括兩個名字(比如google.com,由google和com構成),最後可以有一個表示根域的點(在規范中,最後有一個點的才是完整域名,但一般認為包括兩個以上名字的域名也是完整域名,哪怕後面沒有點)。

2、c語言正則表達式抓取網站的<title>?

在c語言中 !代表 邏輯運算符非,5 是非0 , 所以 !5 表示 0。 C語言是一門通用計算機編程語言,應用專廣泛。屬C語言的設計目標是提供一種能以簡易的方式編譯、處理低級存儲器、產生少量的機器碼以及不需要任何運行環境支持便能運行的編程語言。

3、正則表達式如何匹配特定的域名?

如何用正則表達是匹配不含mtalk.google.com、talk.google.com、talkx.l.google.com、talk.l.google.com的其他google域名?


/^[^(mtalk)(talk)(talkx.l)(talk.l)].google.com$/g

4、求助一個正則表達式篩選域名

很高興能回答你的問題:

(?<=<site>)[^/<]*(?=</|/)

如上使用零寬斷言:

匹配<site>後麵包含除了【/】和【<】以外的任意字元(不匹配<site>)。

匹配【</】或者【/】的結束位置(不匹配【</】和【/】)

這樣,能處理:

<site>www.abc.com</site>


使用grep測試結果:

[^/<]
# 你可以在【^】後面增加任何字元,以保證排除在外,包括空格

5、怎麼用正則表達式提取電子郵箱的賬戶名和域名?

網上找一個郵箱的正則,然後把@前面的和後面的用括弧括起來,就可以吧賬戶名和域名分到分組里了,可以用\1 \2進行引用,或者程序庫提供的其他功能引用

6、用正則表達式提取網址中的IP怎樣取?

沒有對IP地址的有效性做檢查:

<html>
<head>
<!--
    將此內容保存為 html 文件,瀏覽器允許運行腳本進行測試。
-->
<script type="text/javascript">
function check()
{
    var str;
    str = document.getElementById("txtInput").value;
    if (str.match(/(d+.d+.d+.d+:d+)/) != null)
    {
        alert("提取IP埠:" + RegExp.$1);
    }
    else
    {
        alert("沒有提取到內容。");
    }
}
</script>
</head>
<body>
    輸入:<input type="text" id="txtInput" value="http://10.1.1.1:8080/abcde/cdf" />
    <button type="button" onclick="check()">正則檢查</button>
</form>
</body>
</html>

7、用C語言編寫一個域名提取的程序,如何選擇抓包工具,域名的正則表達式怎麼寫?

用libpcap這個工具,很強大。

抓包部分在中文手冊中有源代碼。我就給你講講獲取域名吧。

首先http包才有域名,並且是你三次握手後第一個包。

包到手後累加14+20+tcp->doff*4後邊的信息中有host:*****的消息
14是MAC頭 20是ip頭 後邊那個 是 tcp頭 長度(由於tcp頭長度不定,但是有標志位的。)
至於怎麼提取你自己寫吧

與c正則表達式獲取域名相關的知識