fp unsam spss mm

StatistikaStatistika

Konsep dasar dan metoda penggunaannya dalam penelitian

Tujuan :Tujuan :

Untuk memajukan pemikiran yang tertib, runut dan jelas, terutama yang berhubungan dengan pengumpulan dan interpretasi data numerik, serta menyediakan sejumlah teknik statistika yang mempunyai kegunaan yang luas dalam penelitian.

Melakukan penyajian, peringkasan dan pencirian data

Statistika adalah cara berpikir perihal ketidakpastian.

Penelitian :Penelitian :

Penyelidikan terencana untuk mendapatkan fakta baru, untuk memperkuat atau menolak hasil hasil percobaan terdahulu.

Penyelidikan demikian ini akan membantu pengambilan keputusan

Pertanyaan yang harus dijawab :Pertanyaan yang harus dijawab :

Untuk setiap perhitungan statistik, selalu muncul pertanyaan mengenai ketelitiannya, berapa angka yang masih dapat dipercaya sebagai akhir dari serangkaian perhitungan yang kita lakukan

Descriptive Inferential

Statistics

Aplikasi Statistik dibagi menjadi dua bagianAplikasi Statistik dibagi menjadi dua bagian ::

Statistik Deskriptif

Menjelaskan / menggambarkan berbagai karakteristik data seperti mean, std dev, variansi dan sebagainya

Statistik Induktif (Inferensi) Membuat berbagai inferensi terhadap sekumpulan data

yang berasal dari suatu sampel. Tindakan inferensi tersebut seperti melakukan perkiraan, peramalan,

pengambilan keputusan dan sebagainya.

Dalam prakteknya kedua bagian statistik tersebut digunakan bersama-sama, umumnya dimulai dengan statistik deskriptif lalu dilanjutkan dengan berbagai analisis statistik untuk inferensi.

Mean

Median

Mode

Measures ofCentral Tendency

Variance

Standard Deviation

Range

Deviation

Mean Deviation

Sum of SquaredDeviation

Measure ofVariability

FrequencyDistribution tables

FrequencyDistribution Polygon

Histogram

Bar Graph

GraphicDisplays

DescriptiveStatistics

z-scores

Single Samplet statistic

Independentt statistic

Dependentt statistic

Estimation

PearsonCorrelation

Phi-coefficient

Linear Regression

Correlation &Regression

Test forGoodness of Fit

Test forIndependence

Chi-Square

InferentialStatistics

Elemen Statistik.Elemen Statistik.

1. Populasi

Sekumpulan data yang mengidentifikasikan suatu fenomena yang tergantung dari kegunaan dan relevansi data yang dikumpulkan.

2. Sampel Sekumpulan data yang diambil / diseleksi dari

suatu populasi. (sampel adalah bagian dari populasi).

3. Statistik Inferensi

Suatu keputusan, perkiraan atau generalisasi tentang suatu populasi berdasarkan informasi yang

terkandung dari suatu sampel 4. Pengukuran Reabilitas dari Statistik Inferensi.

Tujuan dari statistik pada dasarnya adalah melakukan deskripsi terhadap data sampel, kemudian melakukan inferensi terhadap populasi data berdasar pada informasi (hasil statistik deskriptif) yang terkandung dalam sampel.

Catatan : Karena sampel yang diambil hanya sebagian dari populasi, dapat terjadi bias dalam kesimpulannya. Sebagai konsekuensi dari kemungkinan timbulnya berbagai bias dalam inferensi, perlu diukur reabilitas dari setiap inferensi yang telah dibuat.

Tipe Data Statistik.Tipe Data Statistik.

Data Kualitatif a. Nominal

Mis gender, tgl lahir dsb yang untuk mudahnya dapat

dikategorikan dengan angka. (level sama)

b. Ordinal

Misal selera, dsb (level tidak sama)

Tipe Data Statistik.Tipe Data Statistik.

Data Kuantitatif a. Data Interval Data yang memiliki jangkauan Mis pengukuran suhu, Cukup panas antara 50 – 80 derajat C, Panas antara 80 – 110 C, dan Sangat panas antara 110 – 140 C b. Data Rasio. Data dengan tingkat pengukuran ter “tinggi” diantara jenis lainnya. Sehingga dapat dilakukan operasi matematika. Mis jumlah barang, berat badan dsb.

Statistik Deskriptif Statistik Deskriptif Bagian ini lebih berhubungan dengan pengumpulan dan

peringkasan data, serta penyajian hasil peringkasan tersebut.

Penyajian tabel dan grafik misalnya

1. Distribusi Frekuensi

2. Histogram, Pie chart dsb

Dua ukuran penting yang sering digunakan dalam pengambilan keputusan adalah :

1. Mencari Central Tendency (mean, median, modus)

2. Mencari Ukuran Dispersi (std deviasi, variansi)

Ukuran lain yang sering digunakan adalah Skewness dan Kurtosis untuk mengetahui kemiringan data.

Statistical NotationStatistical Notation

Variabel biasanya ditulis sbg “x” dan “y” Untuk populasi dinotasikan dg huruf besar “N”

(“N” for populations and “n” for samples) Sigma (Σ ) mewakili operasi penjumlahan

X y xy x+1 x2

2 3 6 3 4

3 5 15 4 9

6 8 48 7 36

4 2 8 5 16


Σx indicates that scores on variable “x” are to be added;

Σy indicates that scores on variable “y” are to be added

In the previous table,

Σ x = 2 + 3 + 6 + 4 = 15

Σ y = 3 + 5 + 8 + 2 = 18

Σ x Σ y = 15*18 = 270


Σ xy indicates that the 2 variables (x and y) are to be multiplied together, then summed.

Σ xy = (2*3) + (3*5) + (6*8) + (4*2) = 77

( 6 + 15 + 48 + 8 = 77)

Note that Σ xy≠ (does not equal) Σ x Σ y (77 vs. 270)


Σ(x+1) indicates that a constant value of 1 is added to each score, then each score is added up

Remember that operations in parenthesis are always done first

Σ (x+1) = (2+1) + (3+1) + (6+1) + (4+1) = 19

= ( 3 + 4 + 7 + 5 = 19)

Notice that Σ (x+1) ≠ Σ x+1 (19 vs. 16)


ΣX2 indicates to square each of the x values, then add them up

ΣX2 = 2² + 3² + 6² + 4² = 65

(= 4 + 9 + 36 + 16=65)

Notice that Σx2 ≠ (Σx) 2 (65 vs. 225)


Dalam statistika hal yang paling penting adalah

PENGAMATAN

Perhatikan data berikut :8, 8, 9, 10, 11, 12, 125, 6, 8, 10, 12, 14, 151, 2, 5, 10, 15, 18, 19

Dan8, 9, 10, 10, 10, 11, 125, 7, 9, 10, 11, 13, 151, 5, 8, 10, 12, 15, 19

Perhatikan data berikut :8, 8, 9, 10, 11, 12, 12 s: 1.65, 6, 8, 10, 12, 14, 15 s: 3.581, 2, 5, 10, 15, 18, 19 s: 6.96

Dan8, 9, 10, 10, 10, 11, 12 s: 1.195, 7, 9, 10, 11, 13, 15 s: 3.161, 5, 8, 10, 12, 15, 19 s: 5.60

Central TendencyCentral TendencyCENTRAL TENDENCY: A statistical measure that identifies a single score that is most

typical or representative of the entire group; a single score or measurement used to describe an entire distribution

Usually, a value that reflects the middle of the distribution is used, because this is where most of the scores pile up

No single measure of central tendency works best in all circumstances, so there are 3 different measures -- mean, median, and mode. Each works best in a specific situation

MODE: The score or category that has the greatest

frequency; the most common score

To find the mode, simply locate the score that appears most often– In a frequency distribution table, it will be the

score with the largest frequency value– In a frequency graph, it will be the tallest bar or

point

Central Tendency (Mode)Central Tendency (Mode)

Example: A sample of class ages is given. . .

Ages f * The age with the highest

23 1 frequency is 19, with a

22 0 frequency of 3; therefore, the

21 1 mode is 19.

20 0

19 3

18 2


A distribution may have more than one mode, or peak: A distribution with 2 modes is said to be bimodal; A distribution with more than 2 modes is said to be multimodal

Example: A sample of class ages. . .

Age f * age 22 and age 19 both23 1 have a frequency of 3; if22 3 this distribution were 21 1 graphed, there would be 20 1 2 peaks; therefore this 19 3 distribution is bimodal --18 2 both 22 and 19 are modes


Advantages:

Easiest to determineThe only measure of central tendency that can

be used with nominal (categorical) dataDisadvantages

Sometimes is not a unique point in the distribution (bimodal or multimodal)

Not sensitive to the location of scores in a distribution

Not often used beyond the descriptive level


MEDIAN: The score that divides the distribution exactly in

half; 50% of the individuals in a distribution have scores at or below the median

Central Tendency (Median)Central Tendency (Median)

Method 1: (Use when N (or n) is an odd number) List the scores from lowest to highest; the middle score on the list is the median

Example: The ages of a sample of class members are 24, 18, 19, 22, and 20. What is the median value?

List the scores from lowest to highest:

18, 19, 20, 22, 24 The middle score is 20 - therefore, that is the

median


Method 2: (Use when N (or n) is an even number) List scores in order from lowest to highest and locate the point halfway between the middle two scores

Example: The ages of a sample of class members are 18, 19, 20, 22, 24 and 30. What is the median age?

The scores are already listed from lowest to highest; select the middle two scores (20, 22) and find the middle point:

212

2220 =+=median


MEAN (µ, x): The mathematical average of the scores The amount that each individual would receive if the

total (Σx) were divided up equally between everyone in the distribution

Computed by adding all of the scores in the distribution and dividing that sum by the total number of scores

Population mean:

Sample mean: x =x∑

n

Central Tendency (Mean)Central Tendency (Mean)

µ =∑x

N

Note that, while the computations would yield the same answer, the symbols differ for a population (µ, N) and a sample (x,n)

Example:

x =x∑

n= 18 + 19 + 19 + 21 + 23

5= 100

5= 20


If a constant is added or subtracted from each score used to compute the mean, the mean will change by the value of that constant

Example: The class scores on a 15-point quiz are 8, 4, 12, 14, 4, and 6. The mean of these scores is. . .

x =x∑

n= 8 + 4 +12 + 14 + 4 + 6

6= 48

6= 8


Suppose the instructor made an error on the quiz and decided to add 1 point to everyone’s score. How would that change the mean?

X+1 * The new scores are 9, 5, 13, 15, 5, &7 8+1= 9 * The new mean is: 4+1= 512+1=1314+1=15 * so, adding a constant to each score 4+1= 5 (x+a) and calculating mean has the 6+1= 7 same result as adding that constant toΣX = 54 the mean (x+ a)

x∑n

= 546

= 9


If all of the scores are multiplied or divided by a constant value, and the mean is then computed, the result will be the same as if the mean were multiplied or divided by that constant

Example: A 10-point quiz is given to a class. Their scores are 6, 5, 7, 8, 10 and 6. The mean is computed. . .

ΣX=42 76

42 ==x


The instructor then decides to change the value of the quiz from 10 points to 20 points. What is the new mean for the class?

X(2) * The new scores are 12, 10, 14, 6(2)=12 16, 20, 12 5(2)=10 * The new mean is: 7(2)=14 8(2)=16 * thus, multiplying each score by10(2)=20 a constant is the same as 6(2)=12 multiplying the mean by the ΣX=84 constant

146

84 ==x


Sensitive to extreme scores, and therefore may not be desirable when working with highly skewed distributions

Example: compare 2 samples of class ages

1) 18, 19, 20, 22, 24

2) 18, 19, 20, 22, 47

Vs.6.201 =x 2.252 =x


Mode

Median

MeanMean – Mode = 3(Mean – Median)

X 1 2 3

| x +/- 1s | = 68.27%

| x +/- 3s | = 99.73%

| x +/- 2s | = 95.45%

Persentase luas daerah antara Mean dan Std Dev

Measures of VariabilityMeasures of Variability

range- (highest score - lowest score) +1

deviation- score - mean

mean deviation- the average absolute deviation score

(Xi − X)

∑ Xi − X

n

(Xhi − Xlow) +1


sum of squares- the sum of the squared deviation scores

– definitional

SS = ∑(Xi − X)2 = ∑(xi )2


variance- the average sum of the squared deviation scores

– sample-

– population-

s2 = SSn −1

=∑(Xi − X)2

n −1

σ 2 = SSN

=∑(Xi − u)2

N

Statistik InferensiStatistik Inferensi

Setelah dilakukan uji terhadap suatu distribusi data, dan terbukti bahwa data yang diuji berdistribusi normal atau mendekati normal, maka pada data tersebut dapat dilakukan berbagai Inferensi dengan metode statistik parametrik.

Tetapi jika dalam pengujian terbukti distribusi data tidak berdistribusi normal atau jauh dari normal maka Inferensi yang dilakukan harus dengan metode statistik non parametrik.

Uji HipotesaUji Hipotesa

Dalam melakukan uji hipotesis, ada banyak faktor yang menentukan seperti apakah sampel yang diambil berjumlah banyak atau hanya sedikit, apakah std deviasi populasi diketahui, apakah variansi dari populasi diketahui, apa metode parametrik yang digunakan, dst.

1. Prosedur Uji Hipotesis

a. Menentukan H0 dan H1

b. Menentukan nilai statistiknya

1. Tingkat kepercayaan

2. Derajat kebebasan

3. Jumlah sampel yang didapat

c. c. Menentukan Statistik hitung, nilai ini

d. tergantung pada metode parametrik

e. yang digunakan.

b. d. Mengambil keputusan, hal ini

ditentukan dengan membandingkan

nilai statistik hitung dengan nilai

statistik tabel atau nilai kritisnya.

Kesalahan :Kesalahan :

Jika kita menolak hipotesa, sedangkan hipotesa benar dikatakan kita melakukan kesalahan type I

Sebaliknya jika kita menerima hipotesa sedangkan hipotesa salah, dikatakan kita melakukan kesalahan type II

Derajat kepercayaan.Derajat kepercayaan.(level of significant)(level of significant)

Dalam melakukan test terhadap hipotesa, maksimum probabitity yang akan kita gunakan untuk mendapatkan resiko Type I disebut derajat kepercayaan

Harga yang umum di gunakan adalah 0.05 dan 0.01

2. Berbagai Metode Parametrik

a. Inferensi terhadap sebuah rata-rata populasi

• sampel besar, gunakan rumus z

• sampel kecil (<30), gunakan student t test

b. Inferensi terhadap dua rata-rata populasi • Sampel besar, gunakan z test yang dimodifikasi • Sampel kecil, gunakan t test yang dimodifikasi atau F test

c. Inferensi untuk mengetahui hubungan antar variabel > Hubungan antar Dua Variabel, meng gunakan metode korelasi dan Regresi sederhana > Hubungan antar lebih dari dua variabel, menggunakan metode korelasi dan regresi berganda

Regresi Sederhana dan KorelasiRegresi Sederhana dan Korelasi

Jika akan dibahas mengenai dua variabel numerik atau lebih, termasuk hubungan di antara keduanya, maka digunakan dua teknik perhitungan, yaitu Regresi dan Korelasi.Dalam analisa Regresi, akan dikembangkan sebuah persamaan regresi yaitu formula matematika yang mencari nilai variabel tergantung (dependent) dari nilai variabel bebas (independent) yang diketahui. Analisa regresi terutama digunakan untuk tujuan peramalan.

Model Matematika yang digunakan :Model Matematika yang digunakan :

Garis Lurus Parabola / Kurva Kuadratik Kurva kubik Kurva Quartic Kurva pangkat n

Biasanya disebut sebagai polinomial berderajat satu, dua, ….dst

Metoda Garis LurusMetoda Garis Lurus

y= a + bx

Metoda Kuadrat TerkecilMetoda Kuadrat Terkecil(Least Square)(Least Square)

Untuk mendapatkan parameter

y = a + bx + e

Statistik Non-ParametrikStatistik Non-Parametrik

Jika data yang ada tidak berdistribusi Normal, atau jumlah data sangat sedikit serta level data adalah nominal atau ordinal, maka perlu digunakan metode statistik alternatif yang tidak harus menggunakan suatu parameter tertentu misalnya Mean, STD Deviasi dll. Metode ini disebut metode Statistik Non Parametrik.

Keuntungannya :Keuntungannya :

• Data tidak harus berdistribusi Normal, (distribution free test)• Dapat digunakan untul level data nominal dan ordinal• Cenderung lebih sederhana

Kelemahan :Kelemahan :

• Tidak ada sistematika yang jelas • Hasil bisa meragukan karena kesederhanaan metodenya • Tabel yang digunakan lebih banyak

Dalam penggunaannya apakah akan digunakan metode parametrik atau non parametrik, semua tergantung pada situasi yang ada, dan keduanya lebih bersifat saling melengkapi dalam melakukan berbagai pengambilan keputusan.

SPSS SPSS ((Statistical Product and Service SolutionsStatistical Product and Service Solutions))

Adalah suatu program komputer statistik yang mampu mengolah/memproses data statistik secara cepat dan tepat, untuk mendapatkan berbagai hasil/keluaran yang dikehendaki para pengambil keputusan

Komponen SPSSKomponen SPSS

1. Data Collection, mengumpulkan data untuk pengolahan data2. Data Preparation, persiapan data untuk pengolahan data lebih lanjut3. Data analysis & Data mining, menyediakan berbagai perhitungan statistik untuk pengolahan data4. Data deployment, mendistribusikan hasil pengolahan data (informasi)

Cara Kerja SPSS (analogi dengan proses komputer)Cara Kerja SPSS (analogi dengan proses komputer)

Pada Komputer

Data Input

Data Output

ProsesKomputer

Pada Statistik

Data InputProses

Statistik

Data Output

Window Pada SPSSWindow Pada SPSS

1. Data Editor– File, Edit, View, Data, Transform, Analize, Graphs, Utilities,– Window, Help

2. Menu Output Navigator

Insert, Format 3. Menu Pivot Table Editor 4. Menu Chart Editor

Gallery, Chart, Series 5. Menu Text Output Editor 6. Menu Syntax Editor 7. Menu Script Editor

Bagian SPSS yang berhubungan dengan Bagian SPSS yang berhubungan dengan Statistik DeskriptifStatistik Deskriptif

1. Frequencies.– Membahas beberapa penjabaran ukuran statistik deskriptif seperti

Mean, Median, Kuartil, Persentil, Standar Deviasi dll 2. Descriptive

– Berfungsi untuk mengetahui skor z dari suatu distribusi data dan menguji apakah data berdistribusi normal atau tidak

3. Explore– Berfungsi untuk memeriksa lebih teliti terhadap sekelompok data

dengan Box-Plot dan Steam and Leaf Plot, selain beberapa uji tambahan untuk menguji apakah data berasal dari distribusi normal.

4. Crosstab– Digunakan untuk menyajikan deskripsi data dalam

bentuk tabel silang. Menu ini juga dilengkapi dengan analisis hubungan di antara baris dan kolom, seperti independensi antara mereka, besar hubungannya dsb

5. Case Summaries– Digunakan untuk melihat lebih jauh isi statistik

deskriptif yang meliputi subgroup dari sebuah kasus.

Penggunaan Regresi dengan SPSS.Penggunaan Regresi dengan SPSS.

1. Pilih menu Analyze – Regression – Linear 2. Tentukan var bergantung dan var bebas 3. Tentukan Metoda yang digunakan (Enter, Stepwise,

Forward, Backward) 4. Tentukan perhitungan statistik yang diperlukan 5. Tentukan jenis plot yang diperlukan 6. Tentukan harga F testnya

fp unsam spss mm

Documents