카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

가장 핫한 댓글은?

논문 데이터 조작을 한 경험이 있습니다

2022.01.22

18

26154

익명으로나마 글을 작성해봅니다.

지금은 미국에 박사과정으로 나와있습니다.

석사과정 시절, 지도교수님은 인격적으로는 훌륭한 분이었으나 연구자로 본받기에는 부족한 사람이었습니다. 교수님이 진행하던 기존의 연구분야와 달리, 새로운 분야를 학부시절부터 셋업하고 스스로 공부해서 연구했었습니다.

당시 지도교수님의 지도 스타일은 매주 진행중인 연구를 미팅에서 발표하고, 오직 '결과'에만 관심 있으셨습니다. 에너지 소재 분야였는데 그 데이터가 의미 있는지 없는지는 관심 없으시고, 다른 물질에 비해 성능이 좋게 나왔는가? 그 자체에만 관심이 있으셨죠.

가령 A 샘플의 성능평가를 위해 샘플 10개를 준비해서 1, 2, 3, 4, 5라는 분석을 해야 하는데, 샘플의 재현성이 충분히 구현되었는지는 상관없이 각 샘플에서 좋은 데이터들만을 뽑아서 논문을 작성하게 했었습니다.

스스로 많이 의문을 가지고 여쭤봤지만 다들 그렇게 한다고 하셨었죠. 그 연구는 나름 괜찮은 저널에 게재되었고 어느 정도는 의미있는 결과이겠지만 저는 아직도 제 연구 결과에 대해서 의심스럽습니다. 사실 창피해서 publish 되고나서도 한번도 들여다보지 않았어요.

창피한 논문입니다. 훗날 제 제자가 읽는다면 아주 민망할 것 같아요.

다행히 박사과정으로 나와서는 지도교수님 성향이 저와 아주 잘 맞아서 다행입니다.

카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

댓글 18개

깜찍한 마르셀 프루스트*

2022.01.22

데이터 조작.. 정말 많다고 생각합니다.
지도 교수님께서 공정하길 원하셔도 보고랑 실적을 위해 조작하는 학생도 있고,
그런 교수님도 계시고..
글쓴분 같은 사람이 많아져야 좋을텐데 말이죠.

2022.01.22

저희실험실에서도 한 선배가 비슷한 방법으로 IF15점 이상의 좋은 저널에 논문을 냈었습니다... 10번 실험하고 그 중 한두번 본인 입맛에 맞는 데이터가 나오면 그거만 교수님한테 보여주는 식으로요

IF : 1

2022.01.22

아마 비슷한 경험 하신 연구자분들 많으실거라 생각합니다. 저도 같은 경험을 했었는데, 연구실 규모가 크다보니 랩미팅 시간은 길고 교수님은 핵심만 알고싶어 하셨었죠. "성능이 잘 나왔는데 일단 검증이 더 필요하다"라는 말은 다음주에 성능이 잘 나왔다는 내용만 기억하시고, 추후 업데이트에서 샘플 문제가 있는것 같다고 하면 이전 데이터를 쓰자고 하셨었죠. 교수님의 성향을 알게된 이후부터는 확실한 데이터가 나올때까지 학생들은 교수님께 데이터를 보고하지 않기 시작했었던 기억이 납니다. 투명하게 보고하고 교수님도 피드백을 해 줘야 발전이 될텐데 말이죠...

2022.01.22

그런데 문제는 그런식으로 낸 논문을 교수님이 전적으로 신뢰하고 그 논문을 토대로 한 후속연구들을 학생들에게 시키는 겁니다. 그러니 당연히 재현도 되지않고 학생들은 스트레스 받고 당연히 진전이 없으니 교수님은 선행 논문 재현도 못하냐면서 학생들한테 뭐라 하고... 피폐하고 답답한 상황입니다

대댓글 1개

2022.09.25

맞습니다 그래서 교수님께 데이터를 보여드릴때 최대한 검증의 검증 그리고 물리적으로 타당한지에대해 재고한뒤 보여드리는것이 저뿐만아니라 후배들을 위해서 옳은길이라 여겨 설령 자체 검증전에 보여드린다해도 반드시 재검증을 한뒤 보고드리겠다 말씀드리는 편입니다 과정과 타당성을 따지기 보단 결과가 어떤지를 더 중요시하는 분들이 많으신것같습니다.. 학생들을 믿어서일까요 아니면 논문&과제 수주를 위한 결과가 있어야하기 때문일까요

2022.01.22

저희는 다른 분야라서 저런 일은 없지만 소재 쪽은 데이터 셀렉팅 유혹이 클거 같긴 하더라고요. 효율 조금 차이나는걸로 저널 급이 확 갈린다고 들었습니다...
재밌는 피터 힉스*

2022.01.22

원래 진흙탕속에 진주가 있듯이 알짜배기들만 의미있는 논문들이고 다 trash일 가능성이 높음 게재된 오픈된 모든 논문들

2022.01.22

논문 데이터 조작은 허다합니다. 워낙에 많아서 이젠 결과치나 데이터는 믿고 거릅니다.

2022.01.22

근데 이건 어쩔수없는것같네요.. 허위 데이터를 올리는건 연구윤리적으로 문제가 되지만, 실험마다 편차가 큰 것중 좋은 데이터를 올리는건 너무 많은것같네요. 분야마다 다르겠지만, 그래서 저희는 탑저널들은 서플멘터리로 잘 구동되는 영상 8편정도는 같이 올려야됩니다..

대댓글 1개

2022.01.22

실제로 좋은저널에 실린 연구를 거의 환경 그대로 재현해도 논문 수준으로 안나오는 경우도 많은데, 분명 몇개는 약간의 페이크나 조작이 들어갔다고 확신합니다.
대담한 버지니아 울프*

2022.01.22

이야 딱 제가 학부때 있던 연구실 환경이네요. 뭐하러 그딴데 2년 가까이 잡고 있었는지 ㅋㅋ 지금 되돌이켜보니 그때는 스스로 어떤 학생인지 몰랐지만, 다른 학부생이면 상상도 못할 단기간 성과를 내는 우수한 학생이었는데도 이런 분위기로 인해서 그 이후 실적 0 찍고(제대로 시행되지조차 않은 관련성도 거의 없는 선행연구 및 교수 벤쳐욕심 충족을 위한 맨땅헤딩) 나머지 시간은 허송세월... 1년이라도 더 빨리 나왔으면 좋았을건데. 수도 없이 나가려다가 지금은 사이도 안좋은 사람이 잡아서 안나갔는데 진짜 무의미한 낭비였네요. 결국 그런데는 남는 게 하나도 없다. 라는 게 정설
점잖은 레오나르도 다빈치*

2022.01.23

그렇게 박사과정동안 데이터 selection해서 좋은 논문 써서 서울대 교수하는 사람 여럿있어요.
즐거운 노엄 촘스키*

2022.01.23

저희 교수님도 그래요. 그리고 옆 연구실도... 처음에는 이게 옳은가 싶다가 저도 어느새 물들었나봅니다. 정신차려야지..

2022.01.24

다른 논문과 비교해서 재료의 성능 향상이 있었으면, 그 이유를 논문에서 설명했을텐데 그래도 어떤 성능 향상의 이유가 있었던건 아닌가요? 사실 저는 학교에도 있어봤고 정출연에서 학연도 해봤는데 정출연 박사들 포닥들도 그러더군요. 내가 봤을때는 분명 데이터 조작인데, 데이터 조작 아니라고 정신승리하는 사람들도 많습니다. 이런식으로 좋은(?) 저널 어떻게든 뚫어서 교수 정출연 한자리하고 또 거기서 이런식으로 논문써서 계속 자리 보전하는 그런식... 연구 윤리 정말 바닥인듯...

2022.01.24

하위 저널권일수록 그런게 많을 것 같아요.. 같은 랩실에 있던 선배들도 실험도 별로 안하는데 매번 데이터가 좋고 있어서 교수님께 칭찬받던게 생각나네요..
나름 열심히 하면서 데이터를 고르고 고르던 저는 밤새 실험하곤 했었는데.. 그 친구는 그냥 한두번 데이터 나오면 논문쓰는걸 당연시 하더라구요..
보통 상위권 저널들은 저런걸 방지하기 위해
모든 데이터에 표준편차를 error bar 로 넣거나 raw data를 공개적으로 제시하지 않으면 받아주지 않는곳도 더러 있습니다..

2023.07.11

누적 신고가 20개 이상인 사용자입니다.

cleanacademia.com

2024.02.25

데이터 조작을 마사지라고 변호하지만
양산용 연구와 연구용 연구가 좀 다르긴 함
연구용 연구는 재현성이 많이 떨어지고 데이터를 살짝 마사지해도
연구 방법론과 physics 스토리가 타당한가 가 중요한 요소임
그러니까 맨날 논문에는 엄청난 신소재와 엄청난 성과들이 쏟아지는데
정작 양산에 적용되는 것은 극소수

이런 걸 다들 알고 있기 때문에 다들 그렇게 한다고 말하는 거고

2025.03.02

별의별거 다 있어요 ㅋㅋㅋㅋ 저도 동료들도 지도교수님이 뻔뻔하게 디렉팅하셔서 '이게 지금 맞아?' 하면서 수행했습니다 ㅋㅋㅋ 서울대 교수님이신데 ㅋㅋㅋㅋㅋㅋ '게으른데 욕심 많으면 저렇게 되는구나'하고 덕분에 게으른데 욕심 많았던 저는 반면교사로 저건 아니구나 싶어서 성실한 연구자로 성장하여 내실있게 실적 쌓아가는 중입니다 ㅋㅋㅋㅋㅋㅋ 아 옛날 생각하니 웃기네요 ㅎㅎ 각자 갈 길 가는 겁니다

댓글쓰기

게시판 목록으로 돌아가기

김박사넷의 새로운 거인, 인공지능 김GPT가 추천하는 게시물로 더 멀리 바라보세요.

자유 게시판(아무개랩)에서 핫한 인기글은?

자유 게시판(아무개랩)에서 최근 댓글이 많이 달린 글

🔥 시선집중 핫한 인기글

최근 댓글이 많이 달린 글