คู่มือฯ การบำรุงรักษา ... · 2014-04-17 · 3 6.1...
TRANSCRIPT
ก
คํานํา
การบํารุงรักษาระบบคอมพิวเตอร ของกรมพินิจและคุมครองเด็กและเยาวชน ครอบคลุมในสวน
ของการบํารุงรักษาเครื่องคอมพิวเตอรแมขาย และอุปกรณเครือขายท่ีติดตั้งอยูท่ีหอง Data Center และระบบฐานขอมูลสารสนเทศ เพ่ือเปนเครื่องมือสําหรับผูดูแลระบบซ่ึงเปนบุคลากรดานเทคโนโลยีสารสนเทศ ในการบริหารจัดการใหมีประสิทธิภาพและเสถียรภาพสูงสุด รองรับการปฏิบัติงานของผูใชงานและบุคลากรภายนอกในการเขาถึงระบบคอมพิวเตอรของกรม
กลุมงานขอมูลและสารสนเทศ เมษายน 2553
ข
สารบัญ
หนา
สารบัญ วัตถุประสงค…………………………………………………..……………………….………..…...1 ขอบเขต…………………………………………………………………………..…..…………...1 คํานิยม…………………………………………………………………………..….......................1 ความรับผิดชอบ…………………………………………………………………...…...…..…......1 ระเบียบปฏิบัติ…………………………………………………………………..….…….……….1 ขั้นตอนการปฏิบัติงาน…………………………………………………………..…..….…..…….2 เอกสารอางอิงท่ีเกี่ยวของ…………………………………...……………..…..…..….……..…….9 แบบฟอรมท่ีเกี่ยวของ.………………………………………………………...….……..…..…….9 เอกสารบันทึก………………………………………………………….……....…..………….…10 วิธีการติดตาม……………………….……………………………………….....…………….….10 ภาคผนวก……………………..……………….…………………………….….…………….…11 คณะผูจัดทํา……………………..……………….……………………………….……….…..…20
1
1. วัตถุประสงค : เพื่อใหมีแนวทางที่เปนมาตรฐานสําหรับการปฏิบัติงานในการ บํารุงรักษาเคร่ืองคอมพิวเตอร แมขายและอุปกรณใหอยูในสภาพพรอมใช ดวยการดําเนินการเชิงปองกัน
- เพื่อยืดอายุการใชงานของเคร่ืองคอมพิวเตอรแมขาย - เพื่อปรับปรุงสภาพของเคร่ืองคอมพิวเตอรแมขาย - เพื่อปองกันหรือลดความเส่ียงที่เคร่ืองคอมพิวเตอรแมขายจะหยุดทํางาน - เพื่อลดปริมาณงานบํารุงรักษาเชิงแกไขกรณีเกิดอุปกรณขัดของหรือมีความเสียหาย
2. ขอบเขต :
ดําเนินการบํารุงรักษาเคร่ืองคอมพิวเตอรแมขาย (Server) จํานวน 8 ชุด พรอมซอฟตแวรระบบ ปฏิบัติการ (Operating System) ฐานขอมูล (Database) ของกรมพินิจฯ
3. คํานิยาม :
เคร่ืองคอมพิวเตอรแมขาย(Server) Database Server S/N 0448AD11AF , Application Server S/N 0448AD11A3, Web Server S/N FN45060047, Fingerprint Database Server S/N SGH452X0AB, Fingerprint Matching Server S/N SGH452X0AA, SGH452X0AC, Broker Server S/N 99GBN60, Report Server S/N 99F5300
4. ความรับผิดชอบ :
หัวหนากลุมงานขอมูลและสารสนเทศ กํากับติดตามการบํารุงรักษาตามกําหนดเวลา เจาหนาที่ทําการสํารองขอมูล
5. ระเบียบปฏิบัต ิ - แนวนโยบายและแนวปฏิบัติในการรักษาความมั่นคงปลอดภัยดานสารสนเทศของหนวยงาน ของรัฐ
2
6. ขั้นตอน (Flow chart)
3
6.1 ตรวจสอบเชิงกายภาพ (สวนท่ี 1) 6.1.1 ตรวจสอบสถานะของ Server
- Switch เปด-ปดทํางานปกต ิ- ระบบไฟแจงเตือนการทํางานของอุปกรณเปนปกติ เชน Fan, I/O, Status - การเชื่อมตออุปกรณ เปนปกต ิ- การทํางานของ Software 6.1.2 กรณีพบปญหาใหทําการแกไขเบื้องตน หากปญหายังคงอยูใหรายงานผูบังคับบัญชาและ - แจงปญหาดังกลาวแก Vender หรือ ผูรับจางในการบํารุงรักษา (ถาม)ี
- Vender เขาดําเนินการตรวจสอบปญหา - Vender ทําการแกไขปญหาแลวรายงานปญหาดังกลาว
6.1.3 ติดตามการแกไขของ Vender - ตรวจสอบการดําเนินการของ Vender - รายงานปญหา และแนวทางการแกไขปญหา 6.2 ตรวจสอบเชิงระบบ (สวนท่ี 2) - ตรวจสอบสถานะของอุปกรณภายใน - ตรวจสอบการใชงาน Hard disk - ตรวจสอบสถานะ RAID Disk OS - ตรวจสอบการทํางานของ Ethernet Interface - ตรวจสอบ Process การทํางาน - ตรวจสอบการทํางานของ Mirror RAID Software - ตรวจสอบ Performance ของ I/O - ตรวจสอบ Performance ของ CPU - ตรวจสอบ Performance ของ Memory - ตรวจสอบ Log Message
4
6.3 ตัวอยางการตรวจสอบ
5
6.4 ตัวอยางปญหาท่ีพบ
ปญหาท่ี 1: Application Server process consumed 100% CPU (on Application Server) ผลกระทบท่ีเกิดขึ้น : Client ไมสามารถ Connect เขาใชงานระบบ Application ผานทางหนา
Web Access ของระบบได สาเหตุของปญหาท่ีพบ : ม ีApplication process ใชการประมวลผล (CPU) 100% เต็ม ทําให
Server Application ไมม ีCPU เพียงพอที่จะสามารถใหบริการดานตางๆแกเคร่ือง Client ได
6
การแกไขปญหาเบื้องตน : ทําการ Restart Application services ที่เปนสาเหตใุหเกิดปญหาโดย
ใช script “StartApp.sh” /DJOP/domains/domain1/DJOP/bin/stopserv
/DJOP/domains/domain1/NECServer/bin/stopserv /DJOP/domains/domain1/NTNSever/bin/stopserv /DJOP/domains/domain1/server1/bin/stopserv /DJOP/domains/domain1/admin-server/bin/stopserv /DJOP/domains/domain1/DJOP/bin/startserv /DJOP/domains/domain1/NECServer/bin/startserv /DJOP/domains/domain1/NTNSever/bin/startserv /DJOP/domains/domain1/server1/bin/startserv /DJOP/domains/domain1/admin-server/bin/startserv
ปญหาท่ี 2: Log file ของระบบ Application Server มีขนาดใหญมาก ผลกระทบท่ีเกิดขึ้น : ไมสามารถเปดดูรายละเอียดตางๆของ Log ไดเนื่องจากมีขนาดไฟลที่ใหญ
มาก และอาจจะมีผลใหเกิดการอานเขียนขอมูลใน Log ไดชาลง สาเหตุของปญหาท่ีพบ : ไมไดทําการลบขอมูลเกาใน Log ออกไปจนทําใหไฟลมีขนาดที่ใหญ
มากจนไมสามารถเปดดูได
7
การแกไขปญหาเบื้องตน : ทําการลบขอมูลเกาๆออกจากไฟล Log จึงทําใหสามารถทําการเปดดูขอมูลในไฟล Log ได File และ Log ของ Database ที่อยูใน Drive D:
File และ Log ของ Database ที่อยูใน Drive E:
8
6.3 สรุปรายงาน Summary Preventive Maintenance: Health Check ดังตัวอยาง
หัวขอการตรวจสอบ ผลที่คาดวาจะไดรับ ผลการตรวจสอบ สถานะทั่วไปของระบบฐานขอมูล สถานะ Database Instance Database Instance ตองเปดและใชงานได ผาน สถานะ Database ระบบฐานขอมูลยังเปดใหใชงานไดปกต ิ ผาน สถานะ online Redo Logs ผาน การใชงานระบบฐานขอมูล สามารถเขาถึง (connect) ระบบฐานขอมูลได ผาน Network การทํางานรวมกับโปรแกรมอ่ืนๆ สามารถใชงานรวมกับโปรแกรม (Application)
อ่ืนได ผาน
Listener Database Listener ตองเปดใชงาน ผาน Listener Log file ตรวจสอบ Listener Log file error ผาน ตรวจสอบ Alert log ไมม ีerror ที่เปนอันตรายตอระบบฐานขอมูล ผาน การสํารองขอมูล (Backup) ตรวจสอบการสํารองขอมูล (Backup)
การสํารองขอมูลตองเสร็จสมบูรณ ผาน
Archived log Mode ฐานขอมูลตองเปด Archived Log Mode ผาน การสราง Archived log ตองสามารถสราง Archived Log ได ผาน พื้นที่สําหรับ Archived Log file ตองมีพื้นที ่(disk) เพียงพอตอการเพิ่มขึ้นของ
Archived Log files ผาน
ความม่ันคงของระบบฐานขอมูล (database security) การใชงาน SYS user เปล่ียนรหัสผานจากคามาตรฐาน (default) ผาน การใชงาน SYSTEM user เปล่ียนรหัสผานจากคามาตรฐาน (default) ผาน ทรัพยากรในการใชงาน (Resource Usage) พื้นที่สําหรับ tables pace ตองมีพื้นที ่(disk) เพียงพอตอการขยาย table space ผาน การใชพื้นที่ระบบฐานขอมูล (database space utilization)
ตรวจสอบการขยายพื้นที่การใชงานฐานขอมูล ผาน
ตรวจสอบขนาดของระบบฐานขอมูล (database sizing)
ไมมีขอมูลสวนใดที่มีการขยายขนาดแบบผิดปกติ ผาน
9
หัวขอการตรวจสอบ ผลที่คาดวาจะไดรับ ผลการตรวจสอบ การทํางาน Rollback Segment สถานะของ rollback segment ตองเปน ONLINE ผาน การทํางาน UNDO table space ตองมีพื้นที่เพียงพอตอการทํางาน ผาน Invalid objects ตองไมมี invalid object หรือ มีนอยที่สุด หรือเปน
object ที่ไมไดเก่ียวของกับการใชงาน ผาน
สถานะทั่วไปของระบบฐานขอมูล Fingerprints สถานะ Service Database Service สามารถทํางานไดเปนปกติ ผาน สถานะ Database ระบบฐานขอมูลยังเปดใหใชงานไดปกติ ผาน สถานะ Server Database, Application ระบบสามารถทํางานงานไดปกติ Memory และ CPU
ไมมีการทํางานสูงเกินไป ผาน
การใชพื้นที่ระบบฐานขอมูล (database space utilization)
ตรวจสอบการขยายพื้นที่การใชงานฐานขอมูล ผาน
ตรวจสอบขนาดของระบบฐานขอมูล (database sizing)
ไมมีขอมูลสวนใดที่มีการขยายขนาดแบบผิดปกติ ผาน
กราฟของ Traffic Network ในชวง 7/09/2010 – 7/10/2010 7. เอกสารอางอิง
Server Name Model OS ServicePack CPU RAM Disk Application DJOP_APS1 SUN V440 Solaris 9 118558-11 1.062x4 GHz 8 GB 72x4 GB Database DJOP_DB1 SUN V440 Solaris 9 118558-11 1.062x4 GHz 16 GB 72x4 GB Web DJOP_WS1 SUN V240 Solaris 9 117171-12 1.28x4 GHz 2 GB 72x2 GB FP Database DJOP_FG1 HP DL380G4 Win 2003 Ent 1 3.0x2 GHz 2 GB 72x8 GB Matching 1 DJOP_MATH1 HP DL380G4 Win 2003 Std 1 3.0x1 GHz 2 GB 36x3 GB Matching 2 DJOP_ MATH2 HP DL380G4 Win 2003 Std 1 3.0x1 GHz 2 GB 36x3 GB Report DJOP_ Report IBM X366 Win 2003 Std 1 3.6x1 GHz 3 GB 73x3 GB Broker DJOP_ Broker IBM X306 Linux Core4 3.6x1 GHz 512 MB 36x1 GB 8. แบบฟอรมท่ีเกี่ยวของ
• แบบบันทึกการปฏิบัติงาน Log Book • แบบบันทึกการตรวจสอบอุปกรณและระบบคอมพิวเตอร (Health Check)
10
9. เอกสารบันทึก ช่ือเอกสาร/อุปกรณ ผูรับผิดชอบ สถานที่จัดเก็บ ระยะเวลาที่
จัดเก็บ วิธีจัดเก็บ
Log Book นักวิชาการคอมพิวเตอร ศูนย IT 5 ป เรียงตามวันที่ Summery Preventive Maintenance Health Check
นักวิชาการคอมพิวเตอร ศูนย IT 5 ป เรียงตามวันที่
10. วิธีการติดตาม
ขอกําหนด ตัวช้ีวัด เปาหมาย ความถ่ี เอกสารที่ใชในการจัดเก็บ ผูรับผิดชอบ การบํารุงรักษาระบบคอมพิวเตอรใหอยูในสภาพพรอมใชงานตลอดเวลา หรือลดความเส่ียงที่อาจเกิดขึ้น
ระยะเวลาเฉล่ียของ Downtime
ไมเกิน 5 ช่ัวโมง ตามแผนการบํารุงรักษา
Summery Preventive Maintenance Health Check
นักวิชาการคอมพิวเตอร
11
ภาคผนวก
1. แบบบันทึกการปฏิบัติงาน Log Book 2. แบบบันทึกการตรวจสอบอุปกรณและระบบคอมพิวเตอร (Health
Check) 3. การนําเทคโนโลยีและความรูขององคกรมาใชประกอบในการ
ออกแบบกระบวนการ 4. บันทึกการปฏิบัติงานหอง Data Center 5. ฟอรมจัดเก็บตัวชี้วัด
12
บันทึกการปฏิบัติงาน หอง Data Center กรมพินิจและคุมครองเด็กและเยาวชน
ว-ด-ป เวลา
ชื่อ-สกุล การปฏิบัติงาน หมายเหต ุเร่ิมตน สิ้นสุด
13
แบบฟอรมจัดเก็บตัวช้ีวัด กระบวนงานการบํารุงรักษาระบบคอมพิวเตอร ขอกําหนด : การบํารุงรักษาระบบคอมพิวเตอรใหอยูในสภาพพรอมใชงานตลอดเวลา หรือลดความเส่ียงที่อาจเกิดขึ้น
ตัวชี้วัด : ระยะเวลาเฉลี่ยของ Downtimeไมเกิน 5 ชั่วโมง เดือน………………………
วันที ่ กิจกรรม ระยะเวลาที่เกิดปญหา สาเหต ุ แนวทางการแกไข ผูรับผิดชอบ หมายเหต ุเวลาเร่ิมตน เวลาส้ินสุด
14
15
16
17
18
19
แบบฟอรมจัดเก็บตัวช้ีวัด กระบวนงานการบํารุงรักษาระบบคอมพิวเตอร
ขอกําหนด : การบํารุงรักษาระบบคอมพิวเตอรใหอยูในสภาพพรอมใชงานตลอดเวลา หรือลดความเส่ียงที่อาจเกิดขึ้น ตัวชี้วัด : ระยะเวลาเฉลี่ยของ Downtimeไมเกิน 5 ชั่วโมง เดือน กันยายน 2553
วันที ่ กิจกรรม ระยะเวลาที่เกิดปญหา สาเหต ุ แนวทางการแกไข ผูรับผิดชอบ หมายเหต ุเวลาเร่ิมตน เวลาส้ินสุด
เมษายน Health check - กลุมงานขอมูลฯ ในรอบปไมเกิดปญหา พฤษภาคม Health check - มิถุนายน Health check - กรกฎาคม Health check - สิงหาคม Health check - กันยายน Health check -
20
คณะผูจัดทําคูมือการปฏิบัติงาน
1. คณะท่ีปรึกษาการจัดทําคูมือการปฏิบัติงาน
1.1 นางอําภา สวางเมฆมรกต ผูตรวจราชการกรม 1.2 นายภูม์ิพงษ ขุนฉนมฉ่ํา ผูอํานวยการสํานักพัฒนาระบบงานยุติธรรมฯ
1.3 นางรัชดาวรรณ ศิริไพบูลย หัวหนากลุมงานขอมูลและสารสนเทศ 2. คณะผูจัดทําคูมือการปฏิบัติงาน 2.1 นายธวัชชัย อัมฤทธ์ิ นักวิชาการคอมพิวเตอร 2.2 นายอนนท ธรรมพรหม นักวิชาการคอมพิวเตอร