티스토리 뷰

SPSS의 첫 포스팅이니 DATA LIST를 얘기하기에 앞서 간단한 소개를 하겠습니다.

 

1장.       SPSS는 무엇인가요?

 

SPSS(Statistical Package for the Social Sciences – 사회과학 통계 패키지)는 통계 분석 프로그램입니다. 통계 분석 프로그램은 여러 종류가 있는데, 각 분야마다 다른 프로그램을 사용합니다. 이유는잘 모르겠습니다. 아직까지는 이유는 못 찾았구요. 저는 SPSS, Minitab, R을 써봤는데요. 그 때 그 때 사용하는 내용들이 달라서 그냥 그렇게 익숙해졌어요. SPSS는 논문을 쓰기 위해 분석할 때 사용을 하구요. Minitab6Sigma에서 분석할 때, R은 실제로 Field에 사용하기 전이라 확실하진 않지만, 파이썬, 하둡과 결합하여 빅데이터를 다루는데 사용한다고 하더라구요.

여담인데, 4차 산업혁명이라는 단어가 정의되면서 빅데이터가 더 부상하게 되었잖아요. 빅데이터와 전혀 관련이 없는 일을 하는 친구가 2년 전쯤 '빅데이터' 트렌드는 지나가지 않았나 라고 했는데, 빅데이터는 계속 거기에 있었고, 지금의 사회 트렌드에 따라 모든 일은 빅데이터랑 연관이 없을수가 없게 된 것 같습니다. 여기에서 빼놓을 수 없는 것이 통계구요.

엑셀로도 간단한 통계는 하실 수 있습니다. 이건 나중에 엑셀 Advanced에서 차례가 되면 설명해드릴께요~~

 

2장.       SPSS를 하기에 앞서

 

다들 SPSS 프로그램은 설치하셨지요?

이 글에서는 SPSS 설치에 대한 부분은 다루지 않습니다. SPSS를 사려면 너무 비싸다고 하구요. 그래서 그런지 정식루트를 통하는 분들은 많이 있는 것 같지는 않습니다. 각자 알아서 구하고 설치해야 하구요~ 어느 버전을 설치하든 왠만한 통계를 다루기에는 부족함이 없다고 합니다.

혹시라도 구하다구하다 실패하신 분들그래서 정말 SPSS를 하고 싶은데 못하시는 분들은 저에게 비밀댓글로 연락부탁드립니다~

이 글은 제가 통계수업을 들은 것을 기초로 정리한 것입니다. 따라서 제가 배우지 않은 통계나 SPSS에 대한 질문에 대해서는 저도 찾아봐서 답변을 드리거나, 답변을 못 드릴 수 있음을 양해 부탁드립니다.

 

3장.       SPSS 의 파일

 

SPSS를 통해 저장되는 파일은 다음과 같이 3가지 종류가 있습니다.

 

 

모두가 하나같이 데이터를 분석하는데는 중요하고 자주 쓰는 파일이니, 익숙해지면 좋을 것 같습니다.(굳이 지금 외우지는 않으셔도 되요. ^^)

 

4장.       Text File DataSPSS로 옮기기 명령어창 활용

 

설문지나 검사지 같은 경우 코딩을 Text File로 하는 경우가 많이 있습니다. 수백개의 설문을 코딩해야 하는데 SPSS에서 직접하거나 엑셀에서 할 경우 시간이 더 오래 걸릴 수 있거든요. 그래서 Text File로 코딩한 다음 SPSS로 옮겨서 분석을 합니다.

이런 경우, SPSS의 메뉴를 활용하는 방법도 있습니다. (그 방법은 이곳에는 없습니다.) SPSS 천재라고 불린다는 제 대학원 동기 친구는 왜 불편하게 명령어창에서 입력하냐고 했다는군요. 근데 저는 메뉴에서 하려고 보니 하나하나 다 클릭을 해야 하는 게 오히려 불편하고 시간이 오래 걸려서 그냥 제가 배운대로 명령어창에서 입력합니다.

새로 명령어창을 열려면 파일 새 파일 명령문으로 들어가시면 됩니다.

(아래 그림을 참고하세요.)

 

 

그리고 나타난 창에서 아래 그림에 표시된 곳에 명령문을 입력하는 거예요.

 

Text File을 가져오는 명령문은 다음과 같습니다.

 

 

TABLE에 있는 설명이 좀 부족한 거 같아서 아래 다시 한 번 설명합니다.

 

 

실행할 때는 실행할 명령문은 선택하고 선택실행버튼을 누르세요!(아래 그림의 빨간색으로 표시된 버튼입니다~)

 

 

 

그렇게 하여 성공하면 출력결과가 다음과 같이 나타납니다.

 

 

IBM Knowledga Center에 있는 DATA LIST의 정의는 다음과 같습니다.

 

DATA LIST defines a raw data file (a raw data file contains numbers and other alphanumeric characters) by assigning names and formats to each variable in the file. Raw data can be inline (entered with your commands between BEGIN DATA and END DATA) or stored in an external file. They can be in fixed format (values for the same variable are always entered in the same location on the same record for each case) or in freefield format (values for consecutive variables are not in particular columns but are entered one after the other, separated by blanks or commas).

대략 해석을 하자면,

 

DATA LIST는 원 데이터 파일의 이름과 포맷 등을 정하여 SPSS 파일의 각 변수로 규정해준다. 원 데이터는 직접 입력도 가능하고, 저장되어 있는 파일을 불러도 된다. 원 데이터는 고정된 형식일수도 있고, 자유형식일수도 있다. – 고정된 형식은 무조건 각 케이스마다 같은 변수의 값이 같은 곳에 위치하고 있어야 하고, 자유형식은 연이은 변수의 값이 빈칸이나 콤마로 구분되어 입력된다.

DATA LIST는 다른 형식으로도 구현할 수 있지만, 우리가 목표하는 바를 이루기 위해서는 제가 위에 설명한 방식으로 하시면 됩니다~~

 

다 마치고 나면 DATA가 맞게 전환되었는지 확인하는 건 기본인 거 다들 아시죠? 이만 DATA LIST 쓰는 방법을 마치겠습니다.

'통계 > SPSS' 카테고리의 다른 글

Data Labeling과 Cleaning  (0) 2017.11.24
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
글 보관함