【環境】
・ESXi6.7ハードウェア2台(それぞれA,Bとする)
・A,BはRTX-830ルータにLANケーブル(cat5e)で接続している
・障害発生するAのNIC:pci接続している82576-2T-X1(RJ45x2)
・VMWare推奨のハードウェア構成ではなく、余りもののパーツを組み合わせている
【障害内容】
Aの仮想ゲストをBの仮想ゲストOSで使用しているバックアップソフト(veeam)でバックアップを取得している時に、Aのnicに接続できなくなります。
Aのnicでmanagement network、その他幾つかの仮想ゲストでも使用しておりますが、vsphere web clientに接続できなかったり、そのnicを使用している仮想ゲストのみネットワークが接続できなくなることから、NIC(82576-2T-X1(RJ45x2))のトラブルと考えております。
Aのその他のnicは通常通り稼働しております。
ハードウェア(nic)に問題があるのか、ESXi上の設定の問題なのか、それ以外の問題なのか切り分けができていない状況です。
ESXiのネットワーク接続トラブルに関係あると思われる/var/log/vmkernel.logの一部ログは下記のとおりです。
2020-04-16T02:16:27.207Z cpu5:2278075)Vmxnet3: 24934: (仮想マシン名),00:50:56:97:fb:1c, portID(50331658): Hang detected,numHangQ: 2, enableGen: 979
2020-04-16T02:16:27.207Z cpu5:2278075)Vmxnet3: 24943: portID:50331658, QID: 0, next2TX: 41, next2Comp: 236, lastNext2TX: 237, next2Write:360, ringSize: 512 inFlight: 2, delay(ms): 32003,txStopped: 0
2020-04-16T02:16:27.207Z cpu5:2278075)Vmxnet3: 24947: portID: 50331658, sop: 236 eop: 236 enableGen: 0 qid: 979, pkt: 0x459ac8398780
2020-04-16T02:16:27.207Z cpu5:2278075)Vmxnet3: 24943: portID:50331658, QID: 1, next2TX: 482, next2Comp: 484, lastNext2TX: 491, next2Write:408, ringSize: 512 inFlight: 13, delay(ms): 36481,txStopped: 0
2020-04-16T02:16:27.207Z cpu5:2278075)Vmxnet3: 24947: portID: 50331658, sop: 484 eop: 486 enableGen: 1 qid: 979, pkt: 0x459ac8209f00
2020-04-16T02:16:27.207Z cpu5:2278075)Vmxnet3: 24947: portID: 50331658, sop: 487 eop: 488 enableGen: 1 qid: 979, pkt: 0x459ac822fa00
2020-04-16T02:16:27.207Z cpu5:2278075)Vmxnet3: 24947: portID: 50331658, sop: 489 eop: 490 enableGen: 1 qid: 979, pkt: 0x459a95179880
2020-04-16T02:16:27.207Z cpu5:2278075)NetSched: 717: 0x3000002: received a force quiesce for port 0x300000a, dropped 205 pkts
2020-04-16T02:16:27.208Z cpu5:2278075)NetPort: 1580: disabled port 0x300000a
2020-04-16T02:16:27.209Z cpu5:2278075)Vmxnet3: 18579: indLROPktToGuest: 1, vcd->umkShared->vrrsSelected: 3 port 0x300000a
2020-04-16T02:16:27.209Z cpu5:2278075)Vmxnet3: 18820: Using default queue delivery for vmxnet3 for port 0x300000a
2020-04-16T02:16:27.209Z cpu5:2278075)NetPort: 1359: enabled port 0x300000a with mac 00:50:56:97:fb:1c
※一部(仮想マシン名)としているOSはzabbixサーバですが、何故これだけエラー表示されているのか不明です。
ESXi上のNIC設定にてオートネゴシエーションを全二重1Gbpsに固定しましたが、特に改善無し。
同様のバックアップ方法でBからAのバックアップ取得時は今まで一度もA,Bともにネットワーク障害無し。
ただし、BのNICはAと同様の物ではない。
【推測】
ネットワーク高負荷(仮想ゲストバックアップ)時のみ切断されると思われる。
特にアップロード時に発生しているように思われる。
トラブル直前は数分1Gbps近く、スピードは出ている。(zabbix監視より)
【暫定対応】
LANケーブルの抜き差しだけで接続が復旧します。
また、リモート(RTX-830にVPN接続)でRTX-830のポートの再起動のみでも接続が復旧します。
以上、何か改善方法がございましたら、ご教授いただけますと助かります。
必要な設定項目、ログ等がございましたら追記致します。
ダメもとでハードウェア構成しておりますので、推奨パーツを使用しろというようなコメントは不要です。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/09 07:19