1、伺服器經常無故死機
電腦死機原因
無法啟動系統,畫面「定格」無反應,滑鼠、鍵盤無法輸入,軟體運行非正常中斷等。盡管造成死機的原因是多方面的,但是萬變不離其宗,其原因永遠也脫離不了硬體與軟體兩方面。
由硬體原因引起的死機
【散熱不良】 顯示器、電源和CPU在工作中發熱量非常大,因此保持良好的通風狀況非常重要,如果顯示器過熱將會導致色彩、圖象失真甚至縮短顯示器壽命。工作時間太長也會導致電源或顯示器散熱不暢而造成電腦死機。CPU的散熱是關繫到電腦運行的穩定性的重要問題,也是散熱故障發生的「重災區」。
【移動不當】 在電腦移動過程中受到很大振動常常會使機器內部器件松動,從而導致接觸不良,引起電腦死機,所以移動電腦時應當避免劇烈振動。
【灰塵殺手】 機器內灰塵過多也會引起死機故障。如軟碟機磁頭或光碟機激光頭沾染過多灰塵後,會導致讀寫錯誤,嚴重的會引起電腦死機。
【設備不匹配】 如主板主頻和CPU主頻不匹配,老主板超頻時將外頻定得太高,可能就不能保證運行的穩定性,因而導致頻繁死機。
【軟硬體不兼容】 三維軟體和一些特殊軟體,可能在有的微機上就不能正常啟動甚至安裝,其中可能就有軟硬體兼容方面的問題。
【內存條故障】 主要是內存條松動、虛焊或內存晶元本身質量所致。應根據具體情況排除內存條接觸故障,如果是內存條質量存在問題,則需更換內存才能解決問題。
【硬碟故障】 主要是硬碟老化或由於使用不當造成壞道、壞扇區。這樣機器在運行時就很容易發生死機。可以用專用工具軟體來進行排障處理,如損壞嚴重則只能更換硬碟了。另外對於在不支持UDMA 66/100的主板,應注意CMOS中硬碟運行方式的設定。
【CPU超頻】 超頻提高了CPU的工作頻率,同時,也可能使其性能變得不穩定。究其原因,CPU在內存中存取數據的速度本來就快於內存與硬碟交換數據的速度,超頻使這種矛盾更加突出,加劇了在內存或虛擬內存中找不到所需數據的情況,這樣就會出現「異常錯誤」。解決辦法當然也比較簡單,就是讓CPU回到正常的頻率上。
【內存條故障】 主要是內存條松動、虛焊或內存晶元本身質量所致。應根據具體情況排除內存條接觸故障,如果是內存條質量存在問題,則需更換內存才能解決問題。
【硬碟故障】 主要是硬碟老化或由於使用不當造成壞道、壞扇區。這樣機器在運行時就很容易發生死機。可以用專用工具軟體來進行排障處理,如損壞嚴重則只能更換硬碟了。另外對於在不支持UDMA 66/100的主板,應注意CMOS中硬碟運行方式的設定。
【CPU超頻】 超頻提高了CPU的工作頻率,同時,也可能使其性能變得不穩定。究其原因,CPU在內存中存取數據的速度本來就快於內存與硬碟交換數據的速度,超頻使這種矛盾更加突出,加劇了在內存或虛擬內存中找不到所需數據的情況,這樣就會出現「異常錯誤」。解決辦法當然也比較簡單,就是讓CPU回到正常的頻率上。
【硬體資源沖突】 是由於音效卡或顯示卡的設置沖突,引起異常錯誤。此外,其它設備的中斷、DMA或埠出現沖突的話,可能導致少數驅動程序產生異常,以致死機。解決的辦法是以「安全模式」啟動,在「控制面板」→「系統」→「設備管理」中進行適當調整。對於在驅動程序中產生異常錯誤的情況,可以修改注冊表。選擇「運行」,鍵入「REGEDIT」,進入注冊表編輯器,通過選單下的「查找」功能,找到並刪除與驅動程序前綴字元串相關的所有「主鍵」和「鍵值」,重新啟動。
【內存容量不夠】 內存容量越大越好,應不小於硬碟容量的0.5~1%,如出現這方面的問題,就應該換上容量盡可能大的內存條。
【劣質零部件】 少數不法商人在給顧客組裝兼容機時,使用質量低劣的板卡、內存,有的甚至出售冒牌主板和Remark過的CPU、內存,這樣的機器在運行時很不穩定,發生死機在所難免。因此,用戶購機時應該警惕,並可以用一些較新的工具軟體測試電腦,長時間連續考機(如72小時),以及爭取盡量長的保修時間等。
由軟體原因引起的死機
【病毒感染】 病毒可以使計算機工作效率急劇下降,造成頻繁死機。這時,我們需用殺毒軟體如KV300、金山毒霸、瑞星等來進行全面查毒、殺毒,並做到定時升級殺毒軟體。
【CMOS設置不當】 該故障現象很普遍,如硬碟參數設置、模式設置、內存參數設置不當從而導致計算機無法啟動。如將無ECC功能的內存設置為具有ECC功能,這樣就會因內存錯誤而造成死機。
【系統文件的誤刪除】 由於Windows 9x啟動需要有Command.com、Io.sys、Msdos.sys等文件,如果這些文件遭破壞或被誤刪除,即使在CMOS中各種硬體設置正確無誤也無濟於事。解決方法:使用同版本操作系統的啟動盤啟動計算機,然後鍵入「SYS C:」,重新傳送系統文件即可。
【初始化文件遭破壞】 由於Windows 9x啟動需要讀取System.ini、Win.ini和注冊表文件,如果存在Config.sys、Autoexec.bat文件,這兩個文件也會被讀取。只要這些文件中存在錯誤信息都可能出現死機,特別是System.ini、Win.ini、User.dat、System.dat這四個文件尤為重要。
2、伺服器百問百答:如何解決伺服器常見故障
伺服器軟體故障是在伺服器故障中佔有比例最高的部份,約佔70%,解決的過程必須更加深思熟慮。導致伺服器出現軟體故障的原因有很多,最常見的是伺服器BIOS版本太低、伺服器的管理軟體或伺服器的驅動程序有BUG、應用程序有沖突及人為造成的軟體故障。下面分別舉例說明各類軟體故障的維修方法。
有一台HP LH6000R伺服器,開機後,系統日誌報電壓調節模塊異常(VRM)的錯誤,報錯的信息是:「Voltage Regulator Mole (VRM) over/under-voltage 2.88V/0V」。從表面來看,極有可能是伺服器的電壓調節模塊或其它硬體出現故障,極容易導致維護人員認為是硬體故障。
維護人員立刻使用其它LH6000R上的硬體來測試,發現即使使用新的配件,此伺服器依然報VRM錯。就在一籌莫展的時候,維修工程師帶來了最新的CPU管理板(CPU Management Control)的固件(FIRMWARE),於是升級了CPU管理板塊的FIRMWARE後,伺服器恢復立即正常。
FIRMWARE升級方法是,在伺服器的NAVIGATOR(導航光碟)中提取CPU管理板(CMC)FIRMWARE的刷新程序,程序為FLASH.EXE,然後將從網上下載的LH6KC.BIN(CPU管理板的FIRMWARE)拷貝到一張DOS啟動盤上,用這張盤啟動伺服器。然後在DOS下運行」FLASH /CMC AH6KC.BIN」,刷新完成後重新啟動伺服器後即可。這種升級方法也適合刷新系統BIOS等,只是FLASH命令的參數不同以及更新FIRMWARE及BIOS文件名不同,參數請參考伺服器的說明。
任何一款伺服器的FIRMWARE及BIOS都會有不同的BUG,因為BUG在所難免,所以我們不能錯誤地認為伺服器的BIOS程序就很完善,而應該經常更新伺服器的FIRMWARE及BIOS,只是在升級之前應該小心謹慎,錯誤的升級方法會導致嚴重的後果。
目前流行的中高檔伺服器都擁有強大的管理程序,為客戶提供了方便的管理途徑;伺服器也擁有各種操作系統下的驅動程序,方便了客戶在各種操作系統中的使用。但是,世上任何一款程序都會有一些BUG,這些BUG將影響用戶使用。但是伺服器廠商總是會在第一時間內開發出新的程序,客戶只需要及時更新這些程序就可以避免這類故障。
當伺服器的軟體故障為此類時,表現的現象也不盡相同。一般來說,管理程序BUG會導致系統速度變慢,CPU佔用率變高,無法正常使用某些功能等;驅動程序的BUG會導致死機、與某些軟體有沖突,磁碟工作不穩定等。查看管理程序是否出錯的最好的辦法就是在系統中首先禁止此類管理工具,再觀察伺服器是否還是異常。
由於管理工具是隨著系統啟動而啟動的,所以應首先避免它的啟動。以WINDOWS NT4為例,就首先在管理工具服務中禁用某些伺服器軟體服務,再修改注冊表中的啟動項即可。如果是驅動程序有問題的話,就以安全模式進入系統,看是否正常。但是需要注意的是,在安全模式中,系統速度變慢是正常的(特別是磁碟I/O方面)。
伺服器的管理人員就應該經常在伺服器網站上下載最新的管理工具程序及驅動程序。這樣會減少很大一部份軟體故障的發生。
相比之下,軟體沖突造成的故障判斷比較困難,需要管理人員有比較豐富的經驗以及敏銳的觀察力。
曾經有一位朋友告訴我說,他有一台浪潮的伺服器無法安裝SQL SERVER 2000,已經重裝N次NT了,排除是系統故障。而這唯一的伺服器又將作為非常重要資料庫伺服器,因此非常著急。於是我陪著朋友去了他的公司查看。這台伺服器所在的機房是非常標准、完善的機房,我檢查了這台伺服器的情況,發現並沒有硬體上的故障,於是排除了光碟機讀盤力差的可能。
但是,朋友刻的SQL SERVER 2000光碟引起了我的懷疑,我讓他拿出了正版的SQL SERVER安裝,結果還是不行。在安裝的過程中,沒有出現絲毫錯誤,可就是在運行的時候會自動退出,沒有任何提示。但是,我在管理工具中的事件查看器的系統日誌中卻發現了一條信息:windata.exe導致一個無效的數據溢出。Windata是朋友自己編寫的一個程序,而且是隨操作系統啟動而啟動的程序。我立即結束掉這個進程後,再運行SQL一切正常。
對於此類軟體故障,操作員最好先查看有關的日誌,看看系統中是否有可疑的進程。目前的伺服器無論是高端還是低端,對於SQL等標准程序的支持是相當可靠的,所以排除的重點就是結束可疑進程。
還有一種軟體故障是人為因素造成的,它一般是人為誤操作(包括沒按操作流程的操作)、意外關機(包括電源突然不供電)或非正常關閉應用程序造成的。
人為誤操作因素只要加強管理都可以避免此類故障發生。在這里就詳細說明意外關機或非正常關閉程序造成故障的方法。
正常關閉系統程序非常重要,尤其是WEB伺服器。我的一個朋友就是因為沒有正常關閉系統程序而經歷了一次數據損壞甚至丟失的經歷。我的朋友是使用的HP web hosting server appliance,因此我向他提供了一些使用規則。
這些方法對於伺服器的維護非常有效,主要包括了正確的關閉系統程序、怎樣避免數據丟失以及非正常關閉系統後的恢復方法。下面以我朋友的HP web hosting server appliance為例(使用的是UNIX,但思路對於其它操作系統均有效)。
3、為什麼總顯示網路故障
解決這個問題有下面幾種方法:
一般處理方式: 更換新的DNS伺服器,或者等待出現故障的DNS伺服器工作正常。有時沒有提示,只說是無法連接到伺服器。如果DNS伺服器出現故障,一部分網頁能正常打開,另一部分網頁不能正常打開,出現此種情況的話,可以修改你的DNS伺服器,如果有兩個DNS伺服器,你可以把首選DNS伺服器和備用DNS伺服器數據調換一下試試看。右擊「網上鄰居」→屬性→右擊本地連接→屬性→Internet 協議(TIC/IP)→屬性→選擇自動獲取DNS伺服器(這是最佳選擇)。也可以自己設置DNS伺服器數據。設置了IP地址以及子網掩碼的話這里也可以保持空白不填寫。當然如果你能准確知道你們當地的DNS數據最好填寫進去。
下面技巧參考:
方法一:開始→運行→cmd→regsvr32 actxprxy.dll→確定→提示→actxprxy.dll中DllRegisterServer成功→確定。然後再次→運行→regsvr32 shdocvw.dll→確定。
方法二:修復TCP/IP網路連接:開始→運行→cmd→輸入→netsh int ip reset→命令後會回車→ipconfig /flushdns來重建本地DNS緩存→重新啟動計算機後IE與網路連接已修復。 方法三:HOSTS文件被修改 文件位置 C:\WINDOWS\system32\drivers\etc 把hosts用記事本打開,內容清空,只保留 127.0.0.1 localhost 這一個條目。
4、為什麼總是說 伺服器故障?什麼都不能看也不能玩,而且又慢得要死
建議先進行體檢殺毒,再清理緩存(伺服器垃圾),再不行就開開瀏覽器設置是否OK,實在不行就換系統唄
5、電腦經常出現DNS服務異常是什麼原因?
主要有以下幾個原因:
1、網路故障。
通常是DNS錯誤所致。
2、網站故障。
如果你只是某個網站打不開,那麼可能是該網站的伺服器發生故障,也可能是網路伺服器的線路發生意外堵塞,導致了一部分的用戶無法打開網頁。
3、病毒所致。
如果你電腦中了病毒,讓你的DNS被劫持,比如自己的瀏覽器主頁被篡改了,打開一些常見網頁打不開或者會有彈窗、跳轉等。
(5)總伺服器故障擴展資料:
DNS故障排除方法:
1、對網路連接情況進行驗證
登錄到DNS伺服器上,並利用ping命令檢查與其它機器的連接狀態。還應該做的就是,嘗試利用隨機機器來ping連接DNS伺服器。請務必牢記,只有在防火牆的配置里容許網際消息控制協議(ICMP)數據包通過的情況下,ping命令才能發揮作用。
2、嘗試利用一台主機進行ping測試
如果本地網路中的名稱解析服務出現問題,就應該選擇嘗試對網路中的其它伺服器進行ping測試。首先,可以利用伺服器的網路IP地址進行ping測試。這樣的話,就可以確認該伺服器是否依然可以連接。接下來,要做的就是利用計算機名稱和伺服器的完全合格域名進行ping測試。
3、重新啟動DNS伺服器
6、伺服器硬體常見故障有哪些
常見伺服器硬體故障排查判斷:
伺服器常見故障的診斷與解決:伺服器故障排除第一部分 伺服器故障排除的基本原則性問題伺服器故障排除一、伺服器開機黑屏故障排查1.檢查供電環境,零-火;零-地電壓?2.檢查電源指示燈,如果亮,正常嗎?3.按下電源開關時,鍵盤上指示燈亮嗎?風扇全部轉動嗎?4.是否更換過顯示器,更換另一台顯示器。5.去掉增加內存6.去掉增加的CPU7.去掉增加的第三方I/O卡8.檢查內存和CPU插的是否牢靠9. Clear CMOS10.更換主要備件,如系統板,內存和CPU伺服器故障排除二、伺服器故障排除的基本原則1.盡量恢復系統預設配置a:硬體配置:去除第三方廠商備件和非標配備件;b:資源配置:清除CMOS,恢復資源初始配置;c: BIOS,F/W,驅動程序:升級最新的BIOS,F/W和相關驅動程序;d: TPL:擴展的第三方的I/O卡屬於該機型的硬體兼容列表(TPL)嗎?2.從基本到復雜a:系統上從個體到網路:首先將存在故障的伺服器獨立運行,待測試正常後再接入網路運行,觀察故障現象變化並處理。b:硬體上從最小系統到現實系統:指從可以運行的硬體開始逐步到現實系統為止。c:軟體上從基本系統到現實系統:指從基本操作系統開始逐步到現實系統為止。3.交換對比a:在最大可能相同的條件下,交換操作簡單效果明顯的部件;b:交換NOS載體,既交換軟體環境;c:交換硬體,既交換硬體環境;d:交換整機,既交換整體環境;伺服器故障排除三、伺服器故障排除需要收集哪些信息?伺服器信息:1.機器型號2.機器序列號(S/N:如:NC00075534)3.Bios版本4.是否增加其它設備,如網卡,SCSI卡,內存,CPU5.硬碟如何配置,是否做陣列,陣列級別6.安裝什麼操作系統及版本(Windows Server, Netware, Sco, others)
7、伺服器顯示故障
估計是硬體有點問題,考慮檢查下
8、伺服器故障一般性故障檢測步驟及解決方案
網路管理員90%的工作往往是診斷和解決各種各樣的故障。雖然說沒有人喜歡麻煩,但麻煩總是自己找上門來。只有擁有高超的診斷技能,你才能在緊急情況下迅速響應,保障網路流暢地運行。當你面臨網路故障的挑戰時,首先向自己問幾個簡單的問題:有哪些地方被改變了?這個問題以前遇到過嗎?如果是,是什麼時候?是否有可能讓問題再次出現?用戶做了什麼特別的操作嗎?其他用戶有沒有遇到過同樣的問題?
接下來嘗試隔離問題,每次排除一部 分可能引起該問題的因素,逐步找出問題的真正根源。例如,如果一個工作站不能連接到伺服器,那就先確定是網路問題還是工作站本身的問題。如果能夠迅速地肯定問題出在工作站本身,你就排除了一大半可能導致問題的因素,向真正的故障根源接近一大步了。即使你最終拿不出解決辦法,不得不尋找外援,隔離問題也會節省你大量的時間。
為了說明診斷網路故障的一般過程,本文例舉了幾種故障情形,有的是常見的小問題,有的是比較艱巨的挑戰。當你遇到類似的問題時,就可以按照本文例子的介紹,先問自己幾個簡單的問題,逐步隔離問題所在,最後找到真正的問題根源。
一、找不到驗證密碼的域伺服器
毫無疑問,你也一定遇到過這樣的情形:當你坐在一台工作站之前准備登錄網路,windows卻報告說找不到用來驗證密碼的域伺服器。要解決這個故障,首先要確定問題到底出在網路、工作站還是伺服器上。從下面幾個問題開始:
→哪些地方改變了?最近是否改動過網路,而這些改動可能導致當前的問題?有沒有添加新的伺服器、拆除原有的伺服器、改動過交換機或HUB?有沒有添加或減少域控制器、將成員伺服器提升為DC(域控制器)或者相反?
→其他工作站也存在類似的問題嗎?
→伺服器正在運行嗎?
經過檢查,你發現此前工作站一直順利地運行,其他工作站沒有遇到類似的問題,伺服器也正常。根據故障現象,基本上可以確定故障出在工作站本身。接下來要確定工作站的那個地方出了故障,試試下面幾個問題:
→工作站能夠Ping到伺服器嗎?
→工作站獲得了一個IP地址嗎?
檢測表明,工作站能夠Ping到伺服器,但Ping操作有時超時,這表明工作站和伺服器之間只有斷斷續續的通信。在命令行上執行ipconfig /renew命令,多執行幾次,工作站有時會更新IP地址,有時不會。這是工作站和伺服器之間斷續通信的症狀。
現在將問題工作站的網路連接和另一台工作站的對換一下,新工作站在問題工作站的位置上也不能連接網路,而問題工作站卻能從另一個網路位置順利地連接網路。現在已經很清楚:問題工作站所在位置的電纜或Hub出了問題。
拆下故障位置上網路電纜連接Hub的那一端,將它接到另一個Hub上,故障依舊。現在可以肯定電纜就是引起故障的罪魁禍首了。
二、windows服務不能啟動
在一台Windows 2000伺服器上,部分服務設置成不用本地的系統帳戶啟動。一次重新啟動Windows 2000伺服器之後,發現這些服務沒有啟動,必須手工打開服務,重新輸入密碼,然後啟動服務。每次重新輸入密碼,都收到消息說:<用戶名字>已被授予作為服務登錄的許可權。
要解決該故障,首先回答下面幾個問題:
→哪些地方改變了?是否有人修改了伺服器?
→這個服務以前能夠啟動嗎?
→用戶名稱和密碼正確嗎?
查詢修改記錄發現,該伺服器是一個DC,不久之前還是域控制器組織單元(OU,Organizational Unit)的成員。在移出該OU之前,這些服務一直能夠順利啟動。另外,用來啟動這些服務的用戶名稱和密碼都是合法的。進一步研究發現,域控制器OU的成員有一些特殊的許可權,其中包括作為服務登錄的許可權。當出現問題的伺服器移出該OU時,伺服器失去了那些許可權。現在要做的是恢復伺服器的許可權。
要將許可權授予伺服器,請按照如下步驟操作:
→在管理控制台(MMC)中打開活動目錄用戶和計算機管理單元,再打開域控制器OU的「屬性」對話框。
→在組策略頁中,點擊「默認域控制器策略」,然後點擊「編輯」,打開組策略管理器。
→依次擴展計算機配置/Windows設置/安全設置,再擴展「本地策略」,然後點擊「用戶權利指派」。
→在右邊的窗格中,右擊「作為服務登錄」,選擇菜單「安全」。
→把用來啟動服務的用戶帳戶加入到策略,完成後點擊「確定」。
有關該問題的更多資料,請參見微軟的文章「如何解決服務啟動許可權問題」(http://support.microsoft.com/?kbid=259733)。
三、無法收到外面發來的郵件
單位用Exchange 2000 Server作為內部和外部的郵件伺服器。有一天原來的ISP不能再提供服務了,所以你迅速換了一個新的ISP。用戶仍舊能夠照常訪問Internet,卻收不到外面來的郵件。不過,發出去的郵件看來沒有問題。
要排解這一故障,第一個要問的問題是:
→在改變ISP之前,郵件系統工作正常嗎?
要確定Exchange Server是否正常工作,防火牆配置是否正確,可以從Internet連接到Exchange Server 25埠(具體操作辦法,請參見微軟文章:Telnet 到 IMC 的埠 25 以測試 IMC 通信, http://support.microsoft.com/?kbid=153119),發送一個測試消息,確認伺服器和防火牆都在正常運行。故障的原因很可能是因為改變ISP。
再回答下面這個問題:
→域名信息正確轉移到了新的ISP嗎?
用Nslookup工具,測試一下是否能夠找到域的郵件交換(MX)記錄,結果卻什麼也沒有找到。根據這一現象,可以推斷在更換ISP時,域名注冊公司沒有正確轉移域名信息。現在你可以聯系域名注冊公司,要求登記MX記錄,以及將域名信息正確轉到新的ISP。只要MX記錄在Internet上一傳播開,Exchange Server又可以收到外面來的郵件了。
四、網路上看不到伺服器
Win2K Pro工作站遇到了奇怪的問題:偶爾能夠看到Win 2K Server,但大部分時間里伺服器就象從網路上消失了一樣。在排解這一網路故障的過程中,首先要回答的問題是:
→過去出現過該故障嗎?
→是否所有的工作站都出現相同的情況?
經調查後發現,這一故障現象自伺服器從 Windows NT 4.0升級到Win2K就開始存在了,網路上的所有工作站都出現同樣的現象。現在要確定的是:故障的根源是伺服器呢,還是網路。
登錄一個工作站,打開命令控制台,執行ping/pathping命令來連接伺服器。結果發現,Ping伺服器的IP地址沒有問題,但卻Ping不到伺服器的名字。可以肯定,故障的原因是名稱解析或DNS錯誤。
接下來執行ipconfig/all,注意到工作站上DNS伺服器指向了ISP的DNS伺服器。Win2K將DNS作為其基本的名稱解析機制,但現在工作站卻用ISP的DNS伺服器來解析本地網路的Win2K伺服器名稱。當工作站向ISP的DNS伺服器查詢Win2K伺服器名稱時,只能得到超時錯誤,導致Win2K伺服器從網路上隱身了。要解決該故障,必須把主DNS伺服器指向內部的Win2K DNS伺服器,讓內網的工作站向Win2K DNS伺服器查詢本地伺服器名稱。
首先證實Win2K伺服器上確實已經安裝了DNS服務,且DNS服務在正常運行,然後修改Win2K DNS伺服器IP地址指向它自己。接下來利用DNS管理器,驗證DNS伺服器位於根位置,且已經啟用轉發。啟用轉發之後,就可以解析非本地的任何IP地址了。不要忘記將ISP的DNS伺服器輸入轉發欄。最後配置一下伺服器上的DHCP,將DNS伺服器從ISP的改成Win2K伺服器,刷新工作站上的IP地址。現在網路已經能夠穩定地運行了。有關在這類環境下配置DNS的信息,請參見微軟的文章「HOW TO:配置 DNS 以訪問 Internet」(http://support.microsoft.com/?kbid=300202)。
五、LAN連接到多個WAN
不久前在A市安裝了一個LAN,它有兩個WAN連接,其中一個連接通向私有的幀中繼網路,另一個連接通向Internet,這是為了防止出現故障和提高性能(圖二顯示了網路結構)。現在出現的故障是:A市的用戶有時不能順利訪問B市的伺服器。
要解決該故障,首先要搞清楚下面兩個問題:
→故障何時出現?
→默認網關是什麼?
故障出現是間歇性的。在A市的DHCP配置中,默認網關是192.168.1.11(即防火牆)。由於A市LAN裡面的所有機器都會出現同樣的故障現象,所以問題很可能出在A市網路上的全局性路由配置上。
在防火牆上有一條靜態路由,從192.168.2.0(掩碼255.255.255.0)到192.168.1.10,用Route Print可以驗證這一規則。A市伺服器有時可以Ping到B市的伺服器,但有時不能。運行Tracert,結果如圖三所示,它顯示出了數據包應當通過的路徑。但有的時候,運行Tracert卻顯示出數據包在第一個躍點(192.168.1.11)之後遇到超時錯誤。根據這一現象,可以推測防火牆沒有可靠地將數據包轉發到控制192.168.2.0通信的Cisco路由器。
查閱防火牆的日誌,可以看到數據包有時被禁止轉發到192.168.1.10,雖然存在這樣一條轉發規則也無濟於事。防火牆的種類很多,但大多數防火牆廠商都反對將防火牆當作路由器,如果防火牆被攻擊者劫持,有關WAN連接的大量信息就會泄露。
因此現在要重新配置網路,使用默認的網關192.168.1.10(即路由器),執行命令Ip route 0.0.0.0 0.0.0.0 192.168.1.11在路由器上建立一個默認的路由。用戶訪問Internet時先通過路由器,再穿越防火牆。
如果A市的路由器(192.168.1.10)出現故障,會對Internet訪問產生哪些影響?如果幀中繼網路失效,但Internet連接仍正常,情況又如何?一旦A市的路由器故障,Internet連接也會丟失,這是因為默認的網關指向了該路由器,該路由器故障導致數據包不能轉發到防火牆。在A市,將DHCP默認網關配置成防火牆可以恢復Internet連接,當然,在恢復A市路由器之前,其他地區的私有WAN和Internet訪問仍舊無效。
六、工作站不能連接網路
辦公大樓五樓的工作站看不到伺服器,也不能訪問Internet。故障間歇性出現。首先要搞清楚的問題是:
→故障出現多長時間了?
→有哪些地方被改變了?
經Pathping工具測試,檢測到一些數據包丟失錯誤。問題看來可以歸結到五樓之內。
利用信號發生器或線纜掃描器追蹤故障,跟蹤網路連接一直到了六樓的Ethernet交換機,五樓和六樓共用該交換機。考慮到可能是交換機埠故障,所以將埠和六樓的一台機器對換了一下,但故障仍舊存在,而且仍只出現在五樓的工作站上,由此推斷,交換機應該沒有問題。
返回五樓,注意到一個辦公室里有個五口的小Hub。進一步查看,注意到還有四個小Hub菊形相連。現在故障的根源找到了。在100 Base-T Ethernet中,每個網路只能有一個Class I轉發躍距(0.7毫秒延遲),或者兩個Class II轉發躍距(0.4毫秒延遲)(由於這個原因,所以不推薦在重要場合使用大量小Hub)。現在拆除所有小Hub,將線頭直接接到六樓的交換機,故障消失。
總地來說,不能認為靠死記硬背就能夠解決所有常見的網路問題,相反地,應當以開放的心態審視每一種故障現象,從幾個簡單的問題開始,逐步排除可能的故障原因。記住,隔離問題是迅速排解故障的關鍵所在。
七、附錄:常用網路診斷工具
Windows XP和Windows 2000提供了許多基本的網路檢測工具:
■ Pathping
Pathping用來檢驗是否能夠聯繫到指定的主機。命令行語法是:pathping 。pathping將顯示出數據包丟失情況的基本信息。
■ Ipconfig
Ipconfig命令用來顯示出工作站的IP配置。命令行語法是:ipconfig /all。通過ipconfig命令的運行結果,至少可以:
→驗證工作站具有正確的IP地址和子網掩碼。錯誤的IP地址和子網掩碼會導致連接出錯。 →如果啟用了DHCP,則可以驗證工作站已經租到了一個IP地址。如果不能獲得IP地址,則表明與DHCP伺服器聯系方面出了問題。
→驗證默認的網關。如果網關錯誤,連接遠程網路或Internet時就會出現問題。
→驗證DNS伺服器。XP和Win 2K依靠DNS進行名稱解析。一般地,工作站應當指向一台Win 2K伺服器以獲得DNS解析。
■ Nslookup
Nslookup即名稱伺服器查找(Name Server Lookup),用來查找DNS伺服器上的DNS記錄。命令語法:nslookup。在前文的例子中,我們用NSLookup來驗證郵件交換(MX)記錄,排解Internet郵件傳送問題。
■ Route Print
Route Print命令顯示出本地機器上的路由規則。這個工具和Ping、Tracert以及Pathping命令結合很有用,能夠幫助確定數據包通過的路由器。命令語法是:route print。另外,利用Route Add可以將靜態路由規則加入到伺服器或工作站。
9、伺服器發生故障是怎回事?
不就是電腦中毒了;解決方法:殺毒或重裝系統。
如果不是中毒的話那就是內DNS伺服器地址不能自動配置容或配置錯誤.如果你可以直接用地址上網那就這種可能性大一些了。操作方法:,在IE瀏覽器中鍵入「202.103.69.205」。如果能夠進入網站那就是我說的第二個原因了。解決方法:手動設置DNS伺服器地址。設置方法:網上鄰居右鍵--屬性--INTERNET連接協議雙擊--使用下面的DNS伺服器地址。如果還不可以就建議重裝系統,然後在手動設置DNS伺服器地址。祝你成功。