달력

52025  이전 다음

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

'학교(3학년1학기)/사회복지자료분석'에 해당되는 글 17건

  1. 2014.04.01 수업 - 4월 1일 (화)
  2. 2014.03.25 수업 - 3월 25일 (화)
  3. 2014.03.20 수업 3월 20일
  4. 2014.03.11 수업 - 3월 11일, 13일 (화) (목)
  5. 2014.03.10 1. 사회과학 연구의 기초
  6. 2014.03.06 수업 - 3월 6일 (목)
  7. 2014.01.28 사회복지자료분석 - 실습계획표

 

 

 

 

확률이라는 것은 이렇게 표시한다. (예: A라는 사건이 발생할 경우의 수를 모든 사건의 경우수를 나누는 경우)

P(A)가 1이면 언재나 일어난다 0이면 Naver happen 덧셈과 곱셈의 법칙

A와B라는 사건이 동시에 일어날 수있는경우에 동시에 일어나는 가능성을 빼줘야 한다.

카드의 경우 카드를 뽑는데 하트또는 Q가 나올경우를 계산을 할 때 하트를 뽑는 경우 13/52 + Q를 뽑는 경우 4/52를 더한 후에 하트에서 나온 Q와 Q에서 나온 하트가 중첩이 되기 때문에 1/52를 빼야 확률이 정확하다. 이 이야기가

P(AorB)=P(A)+P(B)-P(A and B) 의 예시이다.

 

 

 

주머니에서 사탕을 두 개 뽑을 떄, 처음과 두 번째 사탕이모두 빨간 사탕일 확률은? 단, 처음 뽑은 것은 다시 주머니에 집어넣고 두번째 것을 뽑는다고 가정한다. 3/10 * 3/10 =9/100 P(A and B) = P(A)*P(B) 만약에 처음 뽑은

 

 

 

 

중심극한 정리: n 사례수가 많을 수록 확률의 분포는 정규분포를 띈다는 뜻이다.

 

 

 

 

± 1 = 68.26%

± 2 = 95.44%

± 3 = 99.74%

If Mean, Median, Mode = 40 , SD = 4

then SD+1 = 44 and SD -1 = 36

 

 

1.아래의 개념을 수식으로 정리하시오

 

Question1

표본의 분포가 Normal Distribution Curve를 취하고 있다고 가정하고, 표본 평균이 40점이고, 표준오차(Standard Error)가 4점일 때, 표본평균이 40점과 44점 사이에 있을 확률은?

Mean = 40

SE = 4

40~44 = 34.13%

 

Question2

중앙대학교 사회복지학과 학생 25명의 표본을 추출하여 통계시험점수에 대한 통계치 평균 75점, 표준편차 15점을 얻었다. 이 학과의 통계학 시험에서 전체 학생들이 받은 평균 점수에 대한 95%의 신뢰 구간을 구하고 해석하시오

n = 25

SD = 15

Mean = 75

Rootn = 5

SE = SD/Rootn = 15/5 = 3

SE - 2 = 69, SE - 1 = 72, SE + 1 = 78, SE + 2 = 81

So 95% 신뢰구간 = 69~81

 

Question3

정규분포를 이루고 있는 모집단으로부터 N=49인 임의표본을 추출하여 평균값과 표준편차를 산출한 결과 각각 110점과 14점이라고 할 때. 95% 신뢰구간을 구하시오

n = 49

SD = 14

Mean = 110

Rootn = 7

SE = SD/Rootn = 14/7 = 2

SE - 2 = 106, SE - 1 = 108, SE + 1 = 112, SE + 2 = 114

So 95% 신뢰구간 = 106~114

 

 

 

'학교(3학년1학기) > 사회복지자료분석' 카테고리의 다른 글

수업 - 4월 8일 (화)  (0) 2014.04.08
수업 - 4월 3일 (목)  (0) 2014.04.03
수업 - 3월 25일 (화)  (0) 2014.03.25
수업 3월 20일  (0) 2014.03.20
수업 - 3월 11일, 13일 (화) (목)  (0) 2014.03.11
Posted by 전설의아이
|

 

 

 

 

사회복지자료분석론 POP QUIZ 4

 

 

'학교(3학년1학기) > 사회복지자료분석' 카테고리의 다른 글

수업 - 4월 3일 (목)  (0) 2014.04.03
수업 - 4월 1일 (화)  (0) 2014.04.01
수업 3월 20일  (0) 2014.03.20
수업 - 3월 11일, 13일 (화) (목)  (0) 2014.03.11
1. 사회과학 연구의 기초  (0) 2014.03.10
Posted by 전설의아이
|

year: 학년 [순서]

age: 연령 [척도]

relig: 종교 [명목]

GPA: 평균 성적 [척도]

socsci: 지금까지 사회과학 과목을 수강한 수(개) [척도]

miles: 학교와 집과의 거리 [척도]

study: 주 평균 공부하는 시간 [척도]

athlete: 대학 운동 대표팀 선수여부(1: 운동선수, 2: 운동선수아님) [명목]

employed: 취업여부(1: 취업 2: 미취업) [명목]

allnight: 주에 밤새워 공부하는 날의 수 [척도]

drink: 술 마시는 정도 척도 [척도]

hsdrink: 고등학교 떄의 술마시는 정도 [척도]

agress: 폭력성의 정도 [척도]

sex: 성 (1:남성, 0:여성) [명목]

 

①학생들이 두 번째로 많이 믿는 종교는 무엇이며, 그 수는 몇 명입니까?

빈도분석

 

②학생들의 연령의 최빈값은 몇 살입니까? 그리고 가장 나이가 많은 학생과 적은 학생은 몇 살입니까?

빈도분석→age→최빈값, 범위, 최소값, 최대값,

기술통계→옵션→최빈값, 범위, 최소값, 최대값

 

③학생들의 평균성적을 학년별로 비교해 볼 때, 가장 높은 평균성적을 받은 학년은 몇 학년이며, 그들의 평균성적은 몇 점입니까?

평균비교→ GPA종속변수로→학년인 year를 독립변수로 →옵션 평균,케이스 수,표준편차, 최소값, 최대값

 

④학생들의 취업률은 얼마나 됩니까? 또, 종교별로 취업한 학생들의 수를 비교해 볼, 어떤 종교를 가진 학생들이 가장 많이 취없하였습니까?

분석→기술통계량→교차분석→행 empliyed 열 relig →셀 퍼센트 행 열 전체

 

⑤2학년 학생들 중 불교를 믿는 학생의 수는 몇 명입니까?

교차분석→ 행 year 열 relig

 

⑥일주일에 10시간에서 15시간 정도 공부한 학생의 평균 성적은 얼마입니까?

변환 다른 변수로 코딩변경→ 10~15로 변수 설정→ 집단별 평균 분석 → 종속변수 gpa 독립변수 공부범주

 

 

 

 

 

 

⑦학생들의 술 마시는 정도와 고등학교 때 술 마시는 정도와의 차이를 비교해 볼 때, 그 차이의 평균값은 몇입니까?

변수계산 → drink - hsdrink →빈도분석 주량차이

 

 

 

 

 

 

⑧학생들 중 고등학교 떄에 비해 술 마시는 정도가 줄어든 학생의 수는 몇 명입니까?

8명

 

⑨학생들의 학교와 집과의 거리의 범위(range)와 IQR 값은 몇입니까?

사분위수 Q3-Q1 = 1-0=1

 

 

 

 

⑩학생들의 평균성적이 상위 10%와 하위 10%에 해당하는 학생들은 몇 명이며, 각각의 평균성적과 표준편차는 어떻게 다릅니까?

기술통계→ GPA →통계량에서 하위10%가 2.2이고 상위10%는3.4이다 →새로운값을 코딩을 해서 범위를 나누어 준다. 1번이 하위 10% 2번이이외의값 3번이 상위 10%이다. 고로 평균 성적과 표준편차가 나온다.

43명, 평균1.97, 표준편차0.16, 평균3.6, 표준편차0.18

 

 

 

 

 

 

 

 

 

⑪학생들의 평균성적은 정규분포를 이루고 있습니까?(분석수치와 그림을 통해 판단해 보세요)

성적→ 통계량 (왜도, 첨도)→ 도표 →히스토그램을 보여달라고 설정 →나온 그림을 통해서 정규분포를 이루고있으니 이루고 있다.

 

 

 

 

 

⑫지금까지 사회과학 과목을 5과목 이상 수강한 학생 수는 몇 명이며, 그들의 평균성적과 표준편차는 몇 점입니까?

우선 오과목이상수강한학생을 변수로 코딩변경을 한다. →데이터 탐색에서 종속변수를 성적 gpa로하고 요인을 오과목으로 한다. 5과목 이상 수강한 학생은 60명이며평균은 2.88이며 표준편차는0.4499이다.

 

 

 

 

⑬2학년 학생들 중 평균성적이 상위 25%에서 50%사이에 드는 학생들의 수는 몇 명입니까?

데이터 케이스 선택 조건을 만족하는 케이스

 

 

 

 

 

 

 

 

 

 

⑭학생들의 평균성적의 표준값의 최빈값은 몇 점입니까?

 

⑮천주교를 믿는 4학년 남학생은 몇 명입니까?

 

 

 

 

'학교(3학년1학기) > 사회복지자료분석' 카테고리의 다른 글

수업 - 4월 1일 (화)  (0) 2014.04.01
수업 - 3월 25일 (화)  (0) 2014.03.25
수업 - 3월 11일, 13일 (화) (목)  (0) 2014.03.11
1. 사회과학 연구의 기초  (0) 2014.03.10
수업 - 3월 6일 (목)  (0) 2014.03.06
Posted by 전설의아이
|

아래의 각 질문에 대한 변수 측정등급이 무엇인지 박히시오.

[1]명목 [2]서열 [3]등간 [4]비율

 

1. 당신의 성별은 무엇입니까? (1)남성 (2)여성   [1]

2. 당신은 몇 살입니까? (  )세     [4]

3. 당신은 어떤 연령대에 속하십니까?   [2]

 (1) 10대 미만 (2) 10대 (3) 20대 (4) 30대 (5) 40대 (6) 50대 (7) 60대 (8) 60대 이상

4. 당신의 학력은 어떻게 됩니까?    [2]

(1)무학 (2) 초등학교 졸업 (3) 중학교 졸업 (4)고등학교 졸업 (5) 대학교 졸업 (6) 대학원 이상

5. 당신에게 대학교에 다니는 자녀가 있다면 그 자녀의 학년은 몇학년입니까?   [2]

(1) 1학년 (2) 2학년 (3) 3학년 (4) 4학년

6. 당신의 건강상태는 어떻습니까?   [2]

(1) 매우 건강하다 (2) 건강한 편이다 (3) 보통이다 (4) 건강이 나쁜 편이다. (5) 매우 건강이 나쁘다.

7, 당신 이외의 가구원 수는 얼마나 됩니꺼? ( )명   [4]

8. 당신의 월평균 근로소득은 얼마나 됩니까? ( )만원    [4]

9. 당신은 어떤 종류의 부동산을 소유하고 계십니까?   [1]

(1)주택 (2)건물 (3)임야 (4)토지 (5)기타 ( )

10. 위에 답하신 부동산을 남에게 빌려주셨다면 전세금 또는 임대보증금 총액은 모두 얼마 입니까?   [2]

(1) 1천만원 미만 (2) 1천~5천만원 미만 (3) 5천~1억원 미만 (4) 1억~5억원 미만

11. 당신의 현재 정규근무시간은 일주일에 몇시간입니까? ( )시간    [4]

12. 정규시간 이외에 초과로 근무하는 시간이 있습니까? (1)없다 (2)있다.   [1]

13. 당신이 일자리를 그만 둔 이유는 무엇입니까?    [1]

(1) 파산, 도산 등으로 인해 (2) 일거리가 없거나 적어서 (3) 영업이 잘 되지 않아서 (4)새로운 사업을 시작하려고 (5) 일이 임시적이거나 장래성이 없어서 (6) 근무시간이나 근무환경이 나빠서 (7) 가사문제로 (8) 기타 9  )

14. 당신의 일자리에 대한 만족도에 관한 질문입니다. 본인의 생각과 가장 가까운 곳에 ○ 표하여 주십시오.  [2]

   매우만족   만족   보통   불만족   매우 불만족

임금 및 소득

취업의 안정성

근무환경

복지후생제도

15. 당신의 정치성향은 어떻습니까?   [1]

(1)보수 (2) 중도 (3) 진보

 

통계란 무엇인가?

학문적으로 (1)사회현상 중 궁금한것을 해결하기위해서 전체 대상을 population 중대학생들이 학교에 대한만족도 이중 중대학생들이 population이 된다. parameten 사회학자들은 sample을 만들어서 질문을 한다.smaple이 statistics 통계로 변한다.

 

분석의 종류는 기술적분석(Descriptive)과 가설에 대해서 검증하는 추론적 분석(Inference)이 있다.

Univariate 하나 변수의 관계
Bivariate 두개 변수의 관계
Multivariate 여러 개 변수의 관계

 

(Parametric)특정한 분포를 띄고 있다는 가정

(non-parametric)특정한 분포를 띄고 있지 않은 가정  예)정규분표

정규분표를 띄게 하기 위해서는 Sample을 늘려야한다. Sample은 크면 클수록 오차가 줄어든다.

 

Frequency 빈도: 세어서 나오는 수, 가장 기초가되는

Proportion 비중: 특정사례 수에서 전체사레수의 비중

Percentage 비율: 비중 곱하기 100%

 

Mean 평균: 전체값을 합쳐서 사례수로 나눈것.

Median 중간값: 순서를 정한후 중간에 있는 값을 뜻한다. 홀수일 경우 중간이고 짝수일 경우 두개의 중간수의 평균

Mode 최빈값: 가장 많이 나온 숫자. 모든개 하나 나올때는 전부다 최빈값이 된다.

 

A         B

100       51

50        50

0         49

Mean A:50 = B:50

 

얼마많큼 값이 퍼져있는가

Range 범위: 최대값과 최소값의 차이를 뜻한다. 

Quartile 사분위값: Q1→하위50%중에서의 중간값 Q2→중간값 Q3→ 상위 50%중에서 중간값

Deviation: 개별값중에서 평균값을 뺀 값, 각 값들이 평균값과 얼마나 떨어져 있는지 알려주는 것  

Variance:

Standard deviation 표준편차: 모든 값에서 평균값을 뺀후에 제곱을 한후 더한후 평균값을 뺀 숫자만큼 나눈 후 루트를 씌운값  (평균-변량)^2의 합/변량의 갯수

 

목요일날 이어서 할 것이다.

 

측정값 

최빈값 

중간값 

평균값 

표준편차 

2,10,8,3,5,9,4,7 

 2,10,8,3,5,9,4,7

 6

 7

 

2,5,8,11,6,13,8,3

 8

 7

 7

 

9,4,1,2,9,5

 9

 4.5

 5

 3.41

3,7,5,2,9,4,5

 5

 5

 5

 

 

 

spss에는 데이터 보기랑 변수 보기가 있다. 아래 화면은 변수보기이다.

값에 설명 넣기: 

 

결측 값 (결측 값이 뭐지???)

 

측도(여기서 명목, 서열, 등간, 비율 변수인지 등등이 결정된다): 

 

아래화면은 데이터 보기이다: 

 

 

네이버에 한국복지패널 검색

데이터 설문지 메뉴얼 등등을 받을 수가 있다.

 

 빈도분석

 

 

 성별과 성적을 넣자

 

 

 

 

보고싶은 값을 키고

 

계속 -> 확인 하면 분석 표가 나온다.

 

 

교차분석

 

 

 

교차분석에 성별과 가수를 넣었다.

 

 

나오는 결과

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'학교(3학년1학기) > 사회복지자료분석' 카테고리의 다른 글

수업 - 3월 25일 (화)  (0) 2014.03.25
수업 3월 20일  (0) 2014.03.20
1. 사회과학 연구의 기초  (0) 2014.03.10
수업 - 3월 6일 (목)  (0) 2014.03.06
사회복지자료분석 - 실습계획표  (0) 2014.01.28
Posted by 전설의아이
|

1.사회과학 연구방법

명제와 가설

과학의 본질은 사물이나 현상의 관계성(relationship)을 경험적으로 규명하는데 있다. 같은 맥락에서 사회과학은 사회적 현상이나 개념들의 관계를 탐구하고 그 흐름을 밝히는 학문이라 하겠다. 일반적으로 과학적 연구에서 관계 없는 개념들을 연구 주제로 선택하는 경우는 거의 없다. 즉 사회과학연구의 핵심은 서로 관계가 있을 법한 개념들의 관계성을 경험적으로 증명해 내는 것이라 하겠다.

 

명제(proposition): 개념과 개념간의 관계를 논리적으로 도출한 문장을 뜻한다. 예로 가정1.교육수준이 높으면 더 행복할 것이다. 가정2.교육수준이 높으면 덜 행복할 것이다. 명제가 성립되려면 두 개 이상의 개념과 그 개념들의 방향성(direction)이 필요하다.

정적 관계(positive relationship): 가정1 과 같이 두 개념이 같은 방향으로 변화하는 관계.

부적관계(negative relationship): 가정2 와 같이 두 개념이 서로 다른 방향으로 변화하는 관계.

이론적 틀(theoretical frame): 연구자는 보통 기존 이론에 기초하여 자신의 연구명제를 설정한다. 여기서 보통 기존이론이 이론적 틀이다.

탐색적 연구(exploratory study):축적된 이론이 전무한 새로운 개념을 연구에 도입할 때 연구자는 관계의 방향성에 관심을 두기 보다는 개념들간의 관계 그 자체를 밝히는데 초점을 두게 되는데 이러한 형태의 연구를 가리켜 탐색적 연구라고 한다.

 

 연구명제는 경험적 검증이 가능하도록 두 단계의 정제과정(개념화와 조작화)을 거치게 된다. 첫번째 과정은 연구에서 사용될 개념의 범위를 명확히 한정하는 것이다. 두번째 과정은 개념화의 과정을 통해 일단 그 범위가 한정된 개념을 현실에서 측정(measurement) 가능하도록 만드는 것이다.

 

개념화: 오해의 여지를 줄이기 위해 우리 연구에서 사용되는 개념이 정확히 무엇을 의미하는지 규정해 주는 과정을 개념화라한다.

조작화: 개념화의 과정을 통해 일단 그 범위가 한정된 개념을 현실에서 측정 가능하도록 만드는 것이다.

변수:조작화를 거친 개념 즉 경험적으로 측정 가능한 수준의 개념을 가리켜 변수라고 한다.

 

 오늘날 사회과학에서는 추상성이 강한 개념들을 측정하는 좋은 방법은 이미 개발되어있는 타당성(validity)과 신뢰성(reliability)을 검증 받은 측정도구를 사용하는 것이다. 특히 조작화의 과정에서 연구자들이 반드시 고려해야 할 사항이 있는데 그것은 바로 측정가능성(feasibility)이다. 아무리 좋은 변수라 하더라도 실제 데이터를 얻는 과정에서 많은 제한이 있다면 이는 결코 좋은 변수라 할 수 없다. 따라서 연구자는 변수를 설정할 때 타당성과 신뢰성을 검토하는 것과 더불어 변수의 측정가능성을 꼭 확인해야 한다

 

"교육수준이 높으면 더 행복할 것이다."를 개념화와 조작화의 과정을 거쳐 연구자는 개념들을 변수로 대체한 새로운 서술문을 만들 수 있다. "정규교육을 받은 연수가 긴 사람일수록 생활만족도지수가 높을 것이다"라는 서술문은 기존 명제를 측정 가능한 수준으로 끌어내린 것이다. 결국 연구자는 연구가설이 옳은지 그른지를 경험적으로 검증해 봄으로서 연구문제의 해답을 찾아내느 것이다. 따라서 가설은 연구의 핵심이며 자료분석의 기본 틀이라 할 수 있다.

 

가설:변수들간의 관계성으로 구성된 문장을 뜻한다. 위의 "정규교육을 받은 연수가 긴 사람일수록 생활만족도지수가 높을 것이다" 이 가설이다.

 

가설의 검증

 가설이 설정되면 이제 남은 단계는 가설을 직접 검증하는 것이다. 우선 연구대상을 결정해야하고 연구대상이 결정되면 이제 연구자는 그 연구대상을 통하여 가설을 검증하게 된다. 가장 완벽하게 가설을 검증하기 위해서는 연구대상에 속한 모든 개체(individual)들을 다 조사해야 할 것이다. 모든개체를 조사하는 데는 막대한 경비와 시간이 소요됨으로 연구대상중에서 일부만을 선택하여 조사하고 전체연구대상의 성격을 추론한다.

 

연구대상: 연구자가 연구결과를 적용시키고자 하는 집단 즉 연구의 주된 관심이 되는 집단을 의미한다.

추론(inference): 전체 연구대상중에서 일부만을 선택하여 조사한 후 그 결과를 바탕으로 전체 연구대상의 성격을 파악하는 것.

표본(sample): 전체 연구대상 중에서 선택된 일부를 가리켜 표본이라 한다.

표본추출: 전체 연구대상 중에서 선택하는 과정.

 

 여기까지 오면은 연구자는 무엇을 측정할 것인지(가설) 그리고 누구를 대상으로 측정 할 것인지(표본)에 대해 결정하였다. 이제 남은 과제는 어떻게 측정할지(연구설계)를 결정하는 것이다. "두 변수가 서로 관계 있다"는 것과 "어떤 변수가 다른 변수에 영향을 준다"는 것은 엄연히 다른 문제이다.

 

인과성(causality): "어떤 변수가 다른 변수에 영향을 준다"를 뜻한다.

 

인과관계와 통계

인과관계의 성립 조건: ①두 변수간에 상관관계가 있다. ②하나의 변수(원인)가 다른 변수(결과)를 시간적으로 선행한다. ③두 변수간의 관계가 외부의 다른 변수로부터 영향 받지 않는다.

 

 지금까지 개발된 그 어떤 통계기법도 연구자에게 원인과 결과를 직접 제시해 주지는 않는다. 원인변수와 결과변수를 구분하는 것은 전적으로 연구자의 논리에 달려 있다. 이 논리는 이론을 통해 정당화 될 수 있다. 연구에서는 생활만족도에 미치는 영향 요소들은 다양하다. 이에 반해 우리 연구에서는 이런 요소들에 대한 고려가 전혀 없기 때문에 교육연수가 생활만족도에 미치는 순수한 영향을 가려내기 어렵다. 그래서 통제를 해야한다. 사회과학연구에서 다른 변수들을 통제하는 궁극적인 이유는 주요 변수간의 인과관계를 정확히 파악하기 위해서다.

 

통제(control): 연구자가 보고자 하는 변수만 남기고 나머지 조건은 다 동일하게 만드는 것이다. 이렇게 조건을 동일하게 만드는 것을 가리켜 통제라고한다.

 

 통제방법중 가장 직접적인 통제방법은 표본에서 동일한 조건을 지닌 개체만 추려내는 것이다. 그러나 이러한 방법으로 변수들을 통제한다면 엄청난 크기의 표본이 필요하다. 변수가 많을 수록 표본의 크기도 더 커야하기 때문에, 이와 같은 방식의 통제는 실현가능성이 희박할 뿐만 아니라 매우 비효율적이다. 그래서 두번째 방법인 실험설계를 통해  다른 요인들을 통제한다.

 

실험설계(experimental design)의 필요충분조건:

①무작위표본추출(random sampling): 연구대상(혹은 모집단)에서 표본을 추출할 때 확률표본추출법(probability sampling)을 사용하는 것을 의미한다.

②무작위할당(random assignment):이렇게 추출된 표본을 실험집단과 통제집단으로 배정할 때 역시 확률표본추출법을 사용하는 것을 의미한다.

③실헙집단(experiment group)과 통제집단(control group): 실험집단이란 계획된 개입을 제공하는 집단이고, 통제집단이란 개입을 제공하지 않는 집단을 의미한다.

 

 실험설계는 우선 무작위 표본추출과 무작위할당을 통해 '확률적'으로 나머지 조건들을 동일하게 만든다. 이제 다른 변수들을 통제한 가운데 개입(원인변수)을 제공하고 실험집단과 통제집단의 차이(결과변수)를 관찰함으로써 두 변수간의 정확한 인과성을 파악하는 것이다. 연구자는 회귀분석이라는 통계기법을 통해 여러 변수들을 한꺼번에 분석하고 통계적으로 통제할 수 있다. 통계적 통제를 통해 연구자는 원인변수와 결과변수의 순수한 관계성을 파악할 수 있을 뿐만 아니라 그 외의 변수들이 결과변수에 얼마나 영향을 미치는지 개별적으로 파악할 수도 있다. 그래서 사람들이 회귀분석을 사용한다.

 

2. 변수의 유형

독립변수(independent variable): 연구모형에서 원인이 되는 변수를 독립변수라고 한다. 설명변수와 예측변수도 이와 같다.

종속변수(dependent variable): 결과가 되는 변수, 반응변수 피예측변수라고도 한다.

매개변수(intermediate variable):독립변수의 영향을 받아서 이를 다시 종속변수에 전달하는 변수가 있는데 이를 가리켜 매개변수라 한다. 매개변수는 독립변수의 입장에서는 영향을 받는 종속변수이지만 종속변수의 입장에서는 영향을 미치는 독립변수로 작용한다.

통제변수(control variable): 우리가 직접 관심을 갖는 변수는 아니지만 독립변수와 종속변수간에 순수한 인과성을 파악하기 위해 연구모형에 포함시키는 변수가 통제변수이다.

 

 독립변수나 종속변수를 규전하는 것과 마찬가지로 어떤 변수를 매개변수로 혹은 통제변수로 설정할 것인가는 전적으로 이론에 근거한 연구자의 판단에 달려있다. 실제 통계분석을 통해 얻은 자료에는 변수들간의 관계 정도만 나타난다. 변수는 연구모형에서 어떤 역할을 하느냐에 따라 독립변수나 종속변수로 혹은 매개변수나 통제변수로 구분되기도 하지만 그 자체가 지니는 속성에 따라 다른 방식으로 구분되기도 한다. 보다 엄밀히 말해서 어떤 형태의 변수값을 갖느냐에 따라 그 변수의 수준이 달라지는 것이다.

 

변수값:변수가 갖는 하위범주를 의미하며 실제 변수를 측정하는 단위이기도 하다.

명목변수(nominal variable): 측정대상의 특징을 구분만 할 수 있는 변수이다. 명목변수에서는 변수값들 간에 서열이나 크기가 존재하지 않는다. 가령 성별이라는 변수는 남성과 여성이라는 두 개의 변수값을 갖는다. 이 때 남성은 '1'로 여성은 '2'로 표현할 수 있는데 이는 단지 기호일 뿐이지 여성이 남성의 2배라거나 남성이 여성보다 높거나 낮다고 말 할 수는 없다. 실제 사회과학에서 사용되는 많은 변수들이 명목변수에 속한다. 거주지역(경기도:1, 충청도:2, 전라도:3, 경상도:4 등)이라던가 지지정당(공화당:1, 민주당:2 자유당:3)과 같은 변수들이 여기에 속한다.

서열변수(ordinal variable): 변수값들 간에 순서(서열)가 존재하는 변수이다. 예컨대 생활만족도라는 변수를 '매우 만족:1, 만족:2, 불만족:3, 매우 불만족:4'으로 측정할 수 있다 이 때 각 변수값들 간에는 일정한 순서가 존재한다. 즉 변수의 값이 커질수록 불만족도가 커진다는 것을 의미한다. 그러나 순서 사이의 거리가 같다고 할 수 없기 때문에 변수값들의 정확한 크기는 알 수는 없으며 따라서 사칙연산도 불가능하다.

등간변수(interval variable): 변수값의 순서뿐만 아니라 순서 사이의 가격을 알 수 있는 변수로 지능지수나 생활만족도등과 같은 척도들이 여기에 속한다. 가령 100점 만점의 생활만족도를 측정하여 갑의 점수는 80점 을의 점수는 40점이라고 했을 때 갑이 을보다 더 높은 만족도를 보인다고 할 수 있으며 그 차이는 40점이라고 말 할 수 있다. 그러나 사회과학영역에서 엄밀한 의미의 등간변수는 그리 많지 않다. 생활만족도의 예만 보더라도 갑이 을보다 높은 만족도를 보인다고 말할 수 있을 뿐이지 40점의 차이가 정확히 무엇을 의미하는지 알 수는 없다. 또한 등간변수는 비율변수와 달리 절대값 0이 존재하지 않는다. 즉 생활만족도 점수가 0이라고 해서 그 사람의 만족도가 전혀 없다는 것은 아니기 때문이다. 따라서 원칙적으로 곱하기와 나누기가 불가능하나 사회과학영역에서는 이를 허용하는 것이 일반적이다.

비율변수(ratio variable): 등간변수의 모든 특성에 더하여 절대값 0이 포함된 변수이다. 따라서 비율변수에서는 사칙연산이 완전히 가능해진다. 그러나 아쉽게도 사회과학영역에서 비율변수의 형태로 측정할 수 있는 변수는 그리 많지 않다. 대표적인 비율변수는 소득이나 가족 수 등이라 하겠다.

 

 높은 수준의 변수형태는 낮은 수준의 변수형태로 전환할 수 있지만 그 반대는 불가능하다. 예를 들어 소득수준을 비율변수로 측정한 후 연구모형에 따라 얼마든지 등간변수나 서열변수로 바꿀 수 있지만 일단 서열변수로 측정된 소득수준을 비율변수나 등간변수로 바꿀 수는 없다. 실제 사회과학연구에서는 간단한 방식으로 변수를 구분하는 것이 일반적이다. 보편적으로 등간변수와 비율변수는 연속변수(continuous variable)로 그리고 명목변수와 서열변수는 범주형변수(categorical variable)로 구분한다. 학자에 따라서는 연속변수를 양적변수(quantitative variable)로 범주형변수를 질적변수(qualitative variable)로 부르기도 한다. 연속변수인지 범주형변수인지 구분하는 것이 중요한 이유는 어떤 형태의 변수들이 결합했느냐에 따라 분석 가능한 통계기법이 다르기 때문이다.

 

 변수의 결합 형태

가능한 분석 방법 

이분/다분변수 - 이분/다분변수
이분변수 - 연속변수

다분변수 - 연속변수

연속변수 - 연속변수 

카이제곱(chi-square)검증

t-검증(t-test)

분산분석(ANOVA)

상관분석(correlation) 

 종속변수

연속변수

이분변수

다분변수

선형회귀분석(linear regression)
이항로지스틱(binomial logistic regression)

다항로지스틱(multinomial logistic regression) 

 

3. 유용한 통계 기법들

'학교(3학년1학기) > 사회복지자료분석' 카테고리의 다른 글

수업 - 3월 25일 (화)  (0) 2014.03.25
수업 3월 20일  (0) 2014.03.20
수업 - 3월 11일, 13일 (화) (목)  (0) 2014.03.11
수업 - 3월 6일 (목)  (0) 2014.03.06
사회복지자료분석 - 실습계획표  (0) 2014.01.28
Posted by 전설의아이
|

1.지식이란

 믿음 또는 신념, 합의된 사실, 경험적 사실, 전통, 권위, 경험, 과학적 방법

 

2.인간이 가질수 있는 탐구의 오류

 ①불완전한 관찰 ②과도한 일반화 ③선별적인 관찰 ④꾸며낸 정보 ⑤비논리적인 이유 ⑥개인 주관적인 이해 ⑦성급한 탐구의 종료 ⑧신비화

 

3.과학적 탐구의 역사

 과학 vs 사회과학

사회과학이 과학적 방법처럼 연구가 가능할까?

사회과학은 사회현상이나 사람을 연구주제로 하기 때문에

물이 100씨가 되면 끓는다

사람은 측정할 수 없기 때문에 안된다.

세심한 관찰의 시간과 실험 비교를 통해서

교수님은 된다고 주장했다.

 

August Comte(1798-1857)

주장: 사회과학도 하나의 학문분야로 발전하기 위해서는 과학적 방법론으로 연구를 해야한다.

신학적인 단계(~1300): 모든 사물에는 신이 있다.

형이상학적 단계(1300~1800):우리가 가진이성 중에 추상적인것으로 사회현상을 설명했다.

과학적인 단계(1800~): 사회과학도 하나의 학문으로 발전하기 위해서는 과학적 방법을 써야한다.

과학실증주의:

원래 오퀴스트 꽁트(August Comte)의 실증철학의 표제로서 역사적 발전의 성격에 대한 학설인 동시에, 사회학의 성격에 대한 학설이었다. 꽁트는, 인류의 정신사에는 3개의 단계가 있다고 보고 각각의 단계를 주된 지적 탐구형식의 성격에 따라 구분했다. 첫번째는 신학이고, 둘째는 형이상학, 그리고 마지막 단계가 과학으로서의 사회학이다. 형이상학은 본질적으로는 신학이 세속화된 것에 지나지 않기 때문에 처음 두 단계에서는 제일 원인(frist cause)과 궁극 원인(final cause)의 추구가 행해진다.

과학적 정신구조의 출현과 함께 이러한 추구는 단념되고 동력인(efficient cause)과 불변 법칙의 추구로 대치된다. 꽁트는 법칙을 기술한 과학으로서의 학문을 기대했다. 그러나 포퍼(Popper)가 지적한 바에 의하면, 꽁트는 법칙의 개념과 추세의 개념을 혼동하고 있었다. 더욱이 인간성을 좌우하는 기본적인 법칙이 심리학적이라는 신념 때문에 사회생활을 직접 관찰하지 못했다.

꽁트가 생시몽(Saint-Simon)으로부터 받은 것은 과학적 방법을 체계화하려는 이상뿐만이 아니었다. 과학적 방법의 보급이 사회생활의 합리적인 형태의 기초가 된다는 신념 또한 포함되어 있었다. 이 새로운 생활양식을 지지하는 것이 꽁트가 설립한 실증주의 교회(positivist church)의 임무였다. 이 교회야말로 그가 그리고 있었던 이상사회에서 도덕 교육을 감독하기도 하고 공공의 합리성을 보증한다고 생각하였다.

실증주의라는 용어는 또 이와는 완전히 다른 학설에서도 사용되어 왔다. 그것은 논리실증주의자, 또는 논리경험주의자로서 알려져 있는 철학자 일파의 학설이다. 이 학설의 중심적인 교의는 어떤 언명의 의미는 그 언명의 검증방법에 의해서 주어진다는 명제에 있다. 그 결과, 검증 불가능한 (혹은 반증이 불가능한) 언명은 무의미하다고 생각되며, 전통적인 형이상학과 신학의 언명도 이 부류에 들어가게 되었다.

이 견해에 의하면 논리학과 수학의 단언은 사실에 기초한 내용은 아니더라도 의미가 있는 과학적 명제가 된다. 이과학철학의 기본이 되는 언어이론은 영미철학의 언어분석적 전통을 수립했다. 그러나 그것이 과학에 대해 적용되기에는 시간이 걸렸다. 그 반항된 형태가 포퍼의 반증논리이다. 그러나 그와 프랑크푸르트 학파 사이의 실증주의 논쟁은 유명한 싸움이다.

실증주의의 여러 가지 용법에 공통적으로 포함되어 있는 의미의 핵심은 두 가지이다. 즉 한편으로는 자연과학을 인간의 지식의 모범으로 생각하는 것이 있고, 또 한편으로는 과학의 성격에 대하여 어떤 특별한 견해를 가지는 것이 있다. 그러나 이 과학론의 문제에 대해서 조차도 여러 실증주의자들의 견해는 극히 다양하며, 설명이 추가되지 않는 한 확실하지 않은 것이다. 그러나 실증주의는 과학의 실재론적 철학의 성립과 해석학의 대두, 마르크스주의 이론때문에 공격을 받고 인기를 상실하고 있다.

[네이버 지식백과] 실증주의 [positivism] (사회학사전, 2000.10.30, 사회문화연구소)

 

Emile Durkheim(1858-1917) 

사회통합 정도가 높은경우 다른사람의 이해서 사람들이자살을 하고

이기적인 자살은 천주교나 개신교에 자살율이 높다.

자살론:

프랑스의 사회학자 '에밀 뒤르켐'(Emile Durkheim, 1858~1917)은 1897년에 발표한 저서 <자살론(Le suicide)>에서 자살을 '사회학적으로' 이야기한다.

뒤르켐에 따른다면 자살은 엄연히 사회 현상이며 자살의 원인 역시 사회적이다. 뒤르켐은 자살이 사회적 현상이라는 것을 보이기 위하여 여러 가지 통계 자료를 조사했다. 그 결과 사람들이 생각하던 것과는 달리, 정신병이나 신경쇠약증 같은 것이 자살과 확정적인 관계가 없다는 것을 밝혔다.

또한 유전적 요소, 개인의 체질, 밤낮의 길이, 계절에 따른 온도의 영향 등, 다양한 신체적, 물질적 조건들이 자살 현상을 설명하기에는 부적합하다는 것을 밝혔다.

뒤르켐은 자살의 유형을 사회통합도에 따라 '이기적 자살'과 '이타적 자살'로 구분하였고, 사회적 규제에 따라 '아노미(anomie)적 자살'과 '숙명적 자살'로 구분하였다.

'이기적 자살'은 개인이 사회에 결합하는 양식(樣式)에서 과도한 개인화를 보일 경우, 즉 개인과 사회의 결합력이 약할 때의 자살이다. 일상적인 현실과 좀처럼 타협 또는 적응하지 못하는 사람들의 자살이 이 경우에 해당한다.

'이타적 자살'은 그 반대로 과도한 집단화를 보일 경우, 즉 사회적 의무감이 지나치게 강할 때의 자살이다. 예컨대 제2차 세계대전 당시 전투기를 몰고 미군 군함으로 돌진했던 일본군 자살특공대(가미가제)가 있다.

'아노미적 자살'은 사회정세의 변화라든가 사회환경의 차이 또는 도덕적 통제의 결여에 의한 자살이다. 아노미(anomie)란 '행위를 규제하는 사회 공통의 가치나 도덕적 규범이 상실된 혼돈 상태'를 뜻하는 개념으로 뒤르켐이 사용한 용어이다. 지금까지 당연하게 여겨지던 가치관이나 사회 규범이 혼란 상태에 빠졌을 때 자주 일어난다.

'숙명적 자살'은 사회가 과도하에 욕망을 억압하기 때문에 생기는 것으로 절망 속의 자살을 낳는데, 노예의 자살이 대표적이다.

[네이버 지식백과] 뒤르켐의 자살론 (시사상식사전, 박문각)

 

4.과학이란 무엇이냐?

관찰, 실험, 비교

통계로할수있는것: 서술, 이해, 설명, 추정

 

과학의 특징 나에게 증거를 보여라, 증거를 보이지 않으면 믿지 않겠다.

show me the number

보편 타당한 증거

 

이론, 논리적, 원인과 결과가 있다.

변수의 언어이다, 패턴을 발견하는 것이다.

 

5.

이론: 변수들의 기초하는 것

변수: 속성들의 논리적인 집합체

속성: 한대상을 다른대상과 구별해낼수있는 특성

내가 사람들을 어떻게 측정할 것인가?

내가 사람들을 어떻게 분석할 것인가?

종속변수: 다른변수로부터 영향을 받는 변수

독립변수: 다른변수에게 영향을 미치는 변수

 

교육수준x이 높으면 소득수준y도 높다.

정적인관계 y=x

아무런패턴이 없으면 y≠x

최악의 관계 y=-x

 

correlation≠cause-effect

상관관계와 인과관계는 완전히 다른것이다.

①시간적으로 원인이 결과를 앞서야한다.

②숫자적으로 볼때 밀접한관계가 있어야 한다.

③제3의 변수에 의해서 관계가 설명되어서는 안된다.

사회과학이 과학적으로 하는 방법이 어려운일은 통제할 변수가 너무 많다.

so 질적연구방법을 사용한다. 수업에서는 실증주의를 다룬다.

 

6.변수에대한 개념정의를 하고 어떻게 측정을 할 것인가에 대해서 고민해야한다.

어떻게 측정하는냐에따라서 분석하는 방법이다르다.

총망라적: 문항수가 부족하지 않고 충분한 경우

예를 들어 문항이 1.기독교 2.불교 3. 천주교일때 힌두교인사람은 선택사항이 없으므로 총망라적이지 않다고 할 수 있다.

상호배타적

두 사건이 상호 배타적이라는 것은 두 사건 중 한 사건이 일어날 확률[P(A or B)]이 두 사건이 각각 일어날 단순 확률[P(A)+P(B)]과 같다는 말이다. 또는 두 사건이 동시에 일어날 확률이 0(영)이 되면 두 사건은 상호 배타적(mutually exclusive)이다. P(A or B)=P(A)+P(B)-P(A and B)여기서 P(A and B)=0이므로P(A or B)=P(A)+P(B) 이 된다. 예를 들면 동전의 앞뒤면이다. a나 b중 하나라도 일어날 확률을 1이라고 할 때, a가 일어날 확률과 b가 일어날 확률의 합이 1이 되는 것이 상호배타적이다. 단연히 a와 b가 동시에 일어날 확률은 제로가 된다.

 

7.신뢰도와 타당도

신뢰도(reliability)

한 자료수집 방법이 다른 연구자, 또는 다른 시기에 유사한 상황 속에서 사용될 때, 일관되고 재현될 수 있는 결과를 가져올 정도를 말한다. 태도의 측정에서 척도의 신뢰도를 높여 주기 위한 많은 노력이 시도되었다. 검사-재검사 신뢰도(다른 시기에 같은 도구를 가지고 같은 대상에 대해 두 번 측정), 복합적 방법(같은 도구의 다른 부분을 같은 대상에 적용하는 것), 그리고 반분법 신뢰도(대상의 반이 대표가 되고 나머지는 그대로 남겨놓고 그 결과를 통계적으로 비교하는 것) 등이 이에 포함된다.

 

사회조사연구에서 표준화된 질문의 사용은 수집된 자료의 신뢰성을 보장하기 위한 필수적인 전제조건이다. 참여관찰과 같은 연구형태에서 자료의 신뢰도의 문제가 일어난다. 왜냐 하면, 비체계적이며 개인적인 자료수집 방법을 사용할 때 검사(check)의 부족 현상이 일어나기 때문이다. 자료의 신뢰도와 타당도는 다른 것이다. 높은 신뢰도는 타당도에 관한 어떠한 정보도 제시하지 않는다.

[네이버 지식백과] 신뢰도[reliability] (사회학사전, 2000.10.30, 사회문화연구소)

 

타당도(validity)

자료를 수집하는 방법이 그것이 대표하고 측정하기를 원하는 현상을 얼마나 대표하고 측정하고 있는가의 정도를 말한다. 타당도는 사회조사에서 기본적인 문제이다. 특정한 개념을 나타내도록 고안된 지표가 실제로 만족스럽게 되고 있는가? 조사연구에서 만들어진 측정도구가 조사자가 측정하고자 하는 속성에 대한 진정한 대표치인가? 예를 들어, 직업은 사회계급에 의해 사람들을 분류하는 데 있어서 만족스러운 대표적 척도인가? 척도의 신뢰도가 아무리 높다고 할지라도 관심의 대상인 특징을 실제로 측정하고 있는가?

타당도는 캠벨(Campbell)과 스탠리(Stanley)에 의해 정의된 두 가지의 유형이 있다. 내적 타당도는 사용된 방법이 특정한 결과에 차이를 가져오는가, 가져오지 않는가 하는 데 초점을 맞춘다. 외적 타당도는 연구의 일반화에 관한 것이다. 측정도구의 타당도를 확증하기 위한 몇 가지의 방법이 있다.

내용타당도(content validity)는 내용에 대한 특정 영역이 어떻게 적절하게 표집되고 있는가에 대한 판단을 하는 것이다. 액면타당도(face validity)는 도구가 측정하고자 하는 것을 어느 정도 측정하고 있는가를 판단한다. 구성타당도(construct validity)는 측정과 측정에 기초가 되는 이론적 조건을 잇는 정도에 관심을 갖는다. 구성타당도는 사회학자들의 큰 관심사 중의 하나이다. 어떠한 단일한 절차도 그것을 충족할 수 없으며, 몇 가지의 측정에서 얻은 증거를 결합하여야 한다.

[네이버 지식백과] 타당도 [validity] (사회학사전, 2000.10.30, 사회문화연구소)

 

8.측정의 수준

범주형변수

명목변수(Nominal):총망라적이고 상호배타적(비슷한것들이 한곳에 묶여있을 때)인 속성으로만 이루어진 변수

수위변수, 서열변수(Ordinal):

 

연속형변수

등간(Interval): 범주를 정하는 것 0이없다. 나누기를 할 수가 없다.

비율(Ratio): 0이 있다. 나누기가 가능하다.

비율로 조사를하면 등간으로 갈수가 있지만 등간은 비율로 갈 수가 없다.

 

Posted by 전설의아이
|

수업 목표 : 사회현상을 가시화시키려는 학문의 진지한 노력에 매력을 느낄 수 있게 한다.


1주차 강의내용 : 

 Introduction & Expectation of the Course (3/3)


1주차 과제 : 

 None


2주차 강의내용 : 

 Basic Introduction of Social Statistics

 Weinbach & Grinnell(2004) Chapter 1

 Pop quiz 1


2주차 과제 :

 None


3주차 강의내용 :

 Descriptive Statistics 1

 Weinback & Grinnell(2004) Chapter 2-3


3주차 과제 :

 Assignment 1


4주차 강의내용 :

 Descriptive Statistics 2

 Pop quiz 2


4주차 과제 :

 Assignment 2


5주차 강의내용 :

 Probability & Inferential Statistics

 Weinback & Grinnell(2004) Chapter 4-5

 Pop quiz 3


5주차 과제 :

 Assignment 3


6주차 강의내용 :

 t-test

 Weinback & Grinnell(2004) Chapter 11.


6주차 과제 :

 None


7주차 강의내용 :

 ANDVA

 Weinback & Grinnell (2004) Chapter 11.

 Pop quiz 4


7주차 과제 :

 Assignment 4


8주차 강의내용 :

 Mid-term Exam


8주차 과제 :

 None


9주차 강의내용 :

 chi-square

 Weinback & Grinnell(2004) Chapter 10.


9주차 과제 :

 Assignment 5


10주차 강의내용 :

 Correlation Analysis

 Weinback & Grinnell(2004) chapter 8


10주차 과제 :

 None


11주차 강의내용 :

 Regression 1

 Weinback & Grinnell(2004) Chapter 9.

 Pop quiz 5


11주차 과제 :

 Assignment 6


12주차 강의내용 :

 Regression 2

 Class Handout


12주차 과제 :

 Assignment 7


13주차 강의내용 :

 Logistic Regression

 Class Handout


13주차 과제 :

 None


14주차 강의내용 :

 Multi - nominal

 Class Handout


14주차 과제 :

 Assignment 8


15주차 강의내용 :

 총정리 & other advanced statistics

 Class Handout


15주차 과제 :

 None


16주차 강의내용 :

 Final Exam


16주차 과제 :

 None



'학교(3학년1학기) > 사회복지자료분석' 카테고리의 다른 글

수업 - 3월 25일 (화)  (0) 2014.03.25
수업 3월 20일  (0) 2014.03.20
수업 - 3월 11일, 13일 (화) (목)  (0) 2014.03.11
1. 사회과학 연구의 기초  (0) 2014.03.10
수업 - 3월 6일 (목)  (0) 2014.03.06
Posted by 전설의아이
|