본 게시글에 대한 답변등록은 학술토론실 게시판에서만 가능합니다.
다음 이전 목록

안녕하세요 회귀분석 Adjusted R-square 관련해서 질문드려요 ㅠㅠ
  • 공유
    • 트위터로 보내기
    • 페이스북으로 보내기
  • 인쇄
  • 즐겨찾기

관련전공경영학,경제학,관광학,교육학,군사학,기타사회과학,농업경제학,무역학,법학,사회과학일반,사회복지학,사회학,신문방송학,심리과학,인류학,정책학,정치외교학,지리학,지역개발,지역학,행정학,회계학

안녕하세요 데이터를 수집해서 패널회귀분석(Unbalanced)을 돌렸는데요. 고정효과모형(Fixed-effect model)을 사용하였습니다.

분석 결과 R-square 값은 0.081522가 나왔으나, adjusted R-square 값이 -0.069188이 나왔습니다;;; 

사용한 총 변수는 종속변수 포함 9개, 관측값은 377개입니다.

adjusted R-square을 구하는 식을 통해 값을 구해도 절대 -는 나오지 않는데 왜 R-studio에서는 -값을 줄까요? 
제가 계산을 잘못한거고 R-studio에서 계산한게 맞는건가요? 도와주세요 ㅠㅠ 

R-studio에서 도출된 결과는 아래와 같습니다.


 

R-studio에서 Plm을 사용하여 회귀분석을 진행했습니다. 




아직 미숙한 석사생입니다 도와주시면 정말 감사하겠습니다 ㅠㅠ 

즐겨찾기
신고
추천0

.

r squared값이 사실상 0이라서 이럴때 adjusted r squared은 마이너스가 나올 수 있습니다. 모형을 다시한번 고려해보심이.. 구글에 minus adjusted r squared 검색하시면 많은 설명을 보실 수 있습니다.
즐겨찾기
신고
추천2

답변 잘 읽었습니다 ㅜㅜ

네 제 연구의 R-squared 값이 낮은 것은 알고 있습니다. 그러나 관련 연구중 SSCI 급에 실린 여러 논문에서도 R-squared 값이 0.1 언저리에 있는 연구들이 상당히 있습니다. 이게 문제가 될 수도 있으나, 제가 수기로 adjusted R-squared를 구했을 때는 -가 나오질 않고 왜 R-studio는 -값이 나오는지가 이해가 되질 않습니다.. ㅠㅠ

또한 SCI급에 게제된 국내 문헌에서는 아예 Adjusted-R squared 값을 적어두질 않았더군요.. 이 논문에서는 within, between, overall R squared 값만 적어두었는데, 전부 0.1 미만이었고 제일 작은 값은 이 0.013이었습니다.

강의에서 다중회귀분석의 경우에는 adjusted R squared 값을 꼭 기입해야한다고 배웠는데, 이렇게 기입 안해도 문제가 없나요? 


즐겨찾기
신고
추천0

.

between within overall은 stata로 panel 모형을 추정할때 나오는것이고 r로 하면 adjusted r squared가 나옵니다. 아래 포스팅 읽어보세요. 그리고 아마 수기보다 프로그램이 정확할것입니다.
https://stackoverflow.com/questions/34706378/calculating-within-between-or-overall-r-square-in-r
즐겨찾기
신고
추천1

종종 생기는 일입니다.

여러가지 가능성이 있습니다만 fixed effect의 더미 갯수가 너무 많은 경우 모델 fit에 비해 변수개수가 많아져서 adjusted r squared값이 낮게 나올수가 있습니다. 개인적인 경험상 multicollinearity등 모델 자체의 문제가 있을경우 minus adjusted r squared가 나오는 경우를 꽤 보았습니다. 사회과학분야에서는 adjusted r squared대신 r squared를 report해도 무방한 것으로 알고있으나, 대개 minus값이 나오는 경우에는 모델에 문제가 있을 확률이 높으니 여러가지 sensitivity test를 통해서 원인을 찾고 문제를 해결하는 것이 좋아보입니다. 나중에 referee들이 수정을 요구했을때 이런 문제들을 해결하기 어려울 수 있습니다.
즐겨찾기
신고
추천1

추가답변 드립니다.

위에서 잘 설명해주신 것과 같이, minus adjusted r squared가 나오는 원인은 기본적으로
1) 변수의 갯수가 많거나, 2) r square 의미 그대로 독립변수를 통해 종속변수 변동을 잘 설명하지 못하는 경우(모델이 좋지 않은 경우)입니다.
물론 이외의 다른 원인이 있을 수 있습니다. 올려주신 결과와 일반적인 사례로 보았을 때, 2번에 해당하는 경우라고 생각됩니다.

직접계산하신 것과 R로 계산한 값이 다르게 나오신다면, R 말고 다른 패키지로 한번 확인해보시는 것도 좋은 방법일 듯 싶습니다.

r square가 매우 낮거나, adjusted r squared를 제시하지 않아도 괜찮냐는 질문에는 사실 상황에 따라 다를 수 있는 것이 가장 정확한 답변이 아닐까 생각됩니다.

기본적으로 SCIE급 좋은 저널에서 r square가 너무 낮고, coef 값이 매우 작고, adjusted r squared를 제시하지 않은 manuscript에 대해서
그부분을 지적하지 않는 리뷰어는 거의 없을 거라고 생각합니다. 제가 리뷰할때도 반드시 지적하는 부분입니다.

다만 실증분석에 사용된 데이터가 매우 구하기 어렵다거나, 모델링 자체만으로도 아이디어가 훌륭한 경우 등
여러가지 이유로 일부 사회과학 분야에서는 r squared/adjusted r squared에 대하여 관대한 부분이 있는 것도 사실입니다.

하지만 거의 대부분의 경우 상당히 낮은 r squared 수준과 minus adjusted r squared는 좋지 않은 모델링 전형적인 결과이기 때문에
연구의 완성도를 높이시기 위해서는 반드시 수정하시는게 맞다고 생각됩니다.
즐겨찾기
신고
추천2

다른 분들 말씀처럼..

그정도 알스퀘어값이면 사실상 기각영역이라서
수치가 +냐 -냐 의미를 두는 것 자체가 의미가 없습니다..
즐겨찾기
신고
추천0
다음 이전 목록
위로가기
전체보기
메뉴는 로그인이 필요한 회원전용 메뉴입니다.