텍스트 마이닝 처리로 품질경영학회지 연구동향 분석
Analysis of Research Trends in Journal of Korean Society for Quality Management by Text Mining Processing
Article information
Trans Abstract
Purpose
The purpose of this study is to analyze the trend of quality research by analyzing the entire JKSQM(Journal of the Korean Society for Quality Management).
Methods
This study is to analyze the frequency of words used in the abstract of the all JKSQM by applying the text mining processing. We use wordcrowd among text mining techniques.
Results
22 words of high frequency were presented in the abstract of the paper published in the JKSQM for 42 years. The frequency of words was shown on a 10 year basis, and the four important words were plotted on a change graph for each Vol. Frequent words of each Vol. are added in the appendix.
Conclusion
The main research results are as follows. First, there has been no significant change in research trends over the last 40 years. Second, the early SQC words have been widely used, and since 1990, many words such as service-oriented words have been used, indicating a change in the times. Third, the use of the words of the 4th industrial revolution since 2010 is weak. In the above analysis, the trend of quality research in Korea is within the quality category and can be considered conservative. Now, it is expected that everything will be changed in the period of the 4th Industrial Revolution, and it is time to study the direction of quality in Korea.
1. 서 론
1965년에 설립한 한국품질경영학회는 54년 동안 한국 산업발전에 맞추어 품질발전에 지대한 영향을 주었다. 한국품질경영학회에서 발행하는 품질경영학회지는 한국 품질의 학술적 발전에 크게 기여하였다. 품질경영학회지는 품질을 연구하는 교수, 컨설턴트 및 품질인들이 품질 연구성과를 공유하는 유일한 학회지로서 2018년 말까지 총 142권, 1290편의 논문을 발행하였다.
품질 연구자들은 품질경영학회지에서 어떤 주제를 중심으로 연구를 수행하고 있고, 관심분야가 어떻게 변화되고 있는지 관심이 높다. 그러나 지금까지 품질경영학회지 전체에 대한 연구 동향 분석에 대한 연구가 없었다. 2016년에 50주년 기념으로 품질경영학회지(Vol. 44(1-2호)) 전체 논문 조사 논문을 7개 범주로 나누어 실었지만, 연구동향 분석보다는 각 주제별로 논문을 간략하게 소개하였다. 품질경영학회지 전반에 대한 연구 동향과는 거리가 있었다. 문헌정보학회에서는 10년 단위로 학술지 흐름을 분석하고 있는 것과 비교하면 품질경영학회지의 전체 논문의 흐름에 대한 연구는 늦은 감이 있다.
본 연구의 목적은 품질경영학회지 전체를 분석하여 품질 연구동향을 분석하는 것이다. 모든 논문을 읽고 연구 내용을 정리하여 연구 동향을 분석하는 작업은 현실적으로 불가능하다. 연구 주제별로 해당 분야 전문가가 관련 논문 모두를 읽고 연구동향을 분석하는 것은 가능하지만 이 경우도 많은 논문을 읽은 전문가 개인 의견이 반영되어 객관적으로 검증 받아야 하는 어려움이 있다. 본 연구는 이러한 내용 분석이 갖는 단점을 보안할 수 있는 텍스트 마이닝 기법을 적용하여 품질경영학회지 전체를 분석하고자 한다. 지금까지 발행된 모든 논문의 초록을 수집하여 텍스트 마이닝 기법중 워드크라우드를 이용하여 많이 사용되는 단어의 빈도수를 계산하여 품질경영학회지의 연구동향을 분석하고자 한다.
2. 텍스트 마이닝 기법 및 품질경영학회지 조사
2.1 텍스트 마이닝 기법
Kao & Poteet(2007)는 텍스트 마이닝을 비구조화되 텍스트로부터 지식을 발견하고 추출하는 것이라고 정의했다. 텍스트 마이닝 기법 도입 후 다양한 분야에서 활용되고 있다. 텍스트 마이닝 기법을 도입하면 주관이 배제된 객관적인 분석이 가능하다.(Kao 2007)
텍스트 마이닝 기법을 논문의 연구동향을 적용하여 분석하는 기법으로는 문헌 클러스터링, 프로파일링 기법, 네트워크 텍스트 분석, 숨은 연구 주제를 찾는 통계 추론 토픽모델링, LDA(Latent Dirichlet Allocation) 기반의 토픽 모델링 등 다양한 방법이 있다.
국내에선 정보관리학회 등에서 논문 초록을 대상으로 텍스트 마이닝 기법으로 연구 동향을 분석한 연구사례가 많다. 박자현 & 송민(2013)은 1970년부터 2012년까지 정보관리학회지 등 관련 학회의 논문 초록을 수집하여 LDA 기반의 토픽모델링 기법을 적용하여 연구동향을 분석하였다(Park 2013). 그 외 많은 연구자들이 있다.
해외에선 미국국립과학원회보의 초록을 대상으로 텍스트 마이닝 기법으로 연구 동향을 분석한 사례가 있으며, 200년 동안의 미국 대통령의 연설문 대상으로 텍스트 마이닝으로 시계열적 추이 등을 분석한 사례가 있다.(Wang & Mccallum, 2006)
최근에는 개인 이메일 SNS 문자 등을 크롤링 기법으로 수집하여 텍스트 마이닝 기법으로 소비자 동향 분석, 선거에서 특정 후보자 선호도 조사 등에 적용하고 있다(Baek, 2018).
본 논문에서 사용한 워드크라우드 기법은 R 언어에서 텍스트 문장을 단어로 나누면, 단어의 빈도수를 세는 기법이다. 텍스트 마이닝 기법중 가장 단순하다. 박자현 & 송민(2013)에서 사용한 LDA 기반의 토틱모델링 기법을 적용하기 위해서 사전에 품질경영의 주요 단어를 그룹핑하는 작업이 선행되어야 하는데, 이 작업은 품질 관련인들의 합의가 있어야 하므로 추후 연구과제로 남겨둔다.
2.2 품질경영학회지 연구 동향 선행 연구
이돈희 등(2012)은 2007년부터 2011년 5년간 품질경영학회지에 게재된 논문 총 228편을 중심으로 연구분야의 주제, 연구 방법, 산업군, 연구자의 소속 등을 기준으로 품질경영학회지의 연구동향 및 연구 경향을 분석하였다.(Lee, et al., 2012).
2016년 한국품질경영학회 50주년 품질경영학회지 특별호에서 연구 주제별로 연구 내용을 간략하게 소개하였다.
권혁무 등(2016)은 통계적 품질관리 분야 연구 논문을 소개하였으며(Kwon, et al., 2016), 김종만 등(2016)은 품질혁신 분야 연구 논문을 소개하였으며(Kim, et al., 2016), 성시일 등(2016)은 신뢰성 분야 연구 논문을 소개하였으며(Sung, et al., 2016), 정규석 등(2016)은 품질경영분야 연구 논문을 소개하였으며(Chung, et al., 2016), 임용빈 등(2016)은 실험계획분야 연구 논문을 소개하였으며(Lim, et al., 2016), 김상익 등(2016)은 통계 분야 연구 논문을 소개하였으며(Kim, et al., 2016), 김연성은(2016) 서비스분야 연구 논문을 소개하였다(Kim, 2016)
이상의 연구들은 논문의 내용 중심의 질적 연구이다. 특히 50주년 특별 논문은 논문을 소개하는 것으로 연구 동향 분석과는 거리가 있다. 텍스트 마이닝 기법으로 품질경영학회지의 연구 동향 분석은 의미 있으면서 시급한 작업이다.
3. 품질경영학회지 연구 동향 분석
3.1 연구설계
본 연구를 통해 알아보고자 하는 연구 동향은 다음과 같이 2가지 주제이다.
연구주제 1: 품질경영학회지 초록에 나타난 가장 많은 품질 단어는 무엇인지 알아본다.
연구주제 2: 10년 단위로 품질경영학회지 초록에 나타나는 단어의 변화는 어떠한지 알아본다.
연구를 수행하기 위해 먼저 한국품질경영학회지 홈페이지에 있는 논문 전체를 대상으로 하였다.
(www.jksqm.org/articles/archive.php).
본 연구는 다음 순서로 진행하였다. 초창기 논문 중 초록이 없는 논문은 제외하고 Vol.5(1977년)부터 Vol.46(2018년)까기 초록이 있는 모든 논문의 영문 초록을 엑셀에 입력하였다. 입력된 엑셀자료를 'R' 프로그래밍 언어를 이용하여 텍스트를 단어로 분류하고, 분류된 단어를 빈도수 별로 정렬하여 다시 엑셀 파일로 저장하였다. 연구 동향 분석에서 의미가 없는 동사, 대명사 등 단어들을 삭제하였다. 예를 들면, that, what, have, be, study, research etc 이다. 또한 품질경영학회지 논문에서 Quality 단어는 의미가 없어 삭제하였다. Quality 단어는 압도적으로 많았다. 마지막으로 보고서를 출력하였다. 그림 3.1은 작업 순서도이다.
3.2 품질경영학회지 조사
한국품질경영학회에서 2018년까지 발행한 품질경영학회지는 표 3,1과 같다. 1966년 1호부터 2018년까지 총 논문집은 142권 발간되었다. 표 3.1과 같이 1966년부터 1978년까지는 일정하게 발행하지 않았다. 1979년부터 1993년까지는 매년 2권씩 발행하고, 1994년 이후 매년 4권씩 발행하였다.
각 논문 Vol.별로 발행된 논문 수는 표 3.2와 같다. 2018년 까지 총 1290편의 논문이 발행되었다. 각 표안의 숫자는 각 Vol.별로 몇 개의 Issue로 발행되었지만, 표 3.2는 각 Vol. 별로 1년간 발행한 총 논문 수를 합하였다.(여기서는 논문 책(1권)과 Vol. 과의 혼돈을 피하기 위하여, 논문집에 표시된 Vol.을 그대로 사용하였다)
논문 1호(1966년)부터 4호까지(1976)는 논문이라기 보다 뉴스레터 같은 형태로 논문의 초록이 없다.(그림 3.2)
Vol.5(1977) 부터 논문의 형태를 갖추었다(그림 3.3). Vol.8(1980)까지도 초록이 없는 논문들이 있어 이러한 논문은 제외하였다.
최근 논문들 Vol.39(2011년) 부터는 HTML로 되어 있어 pdf 파일 논문의 초록을 드래그하여 엑셀에 그대로 입력되나, 2010년 이전 논문은 모두 그림 파일로 되어 있어, 모두 타이핑으로 입력하였다.
3.3 분석 결과
연구주제 1: 품질경영학회지 초록에 나타난 가장 많은 품질 단어는 무엇인지 알아본다.
Vol.5(1977)부터 Vol.46(2018) 42년 간 품질경영학회지의 초록에서 많이 사용한 단어를 빈도수가 많은 단어 22개를 정리한 결과가 표 3.3과 같다. 10년 단위로 분석한 자료와 각 Vol. 별로 분석한 자세한 자료는 부록 1에 있다.
100회 이상 사용된 22개 단어는 품질 범주에서 많이 사용되는 익숙한 단어들이다. [process, system, model, service] 단어는 600번 이상 사용 되었으며, [management, data, methods] 단어는 400번 이상 사용 되었다. 품질경영학회지 논문에 발표된 논문들은 품질 범주내에서 많은 연구가 이루어지고 있다는 것을 알 수 있다. 품질에서 많이 사용되지 않는 예상치 못한 단어가 많이 사용되지 않았다는 의미에서 한국 품질 연구는 보수적이라고 볼 수 있다.
연구주제 2: 10년 단위로 품질경영학회지 초록에 나타나는 단어의 변화는 어떠한지 알아본다.
Vol.10 단위로 주요 단어 10개씩 순위는 표 3.4와 같다.
표 3.3에서 600번 이상 사용된 4단어는 [process, system, model, service]중 [process]는 최근에는 사용이 적고, [system, model]은 계속 많이 사용되며, [service]는 최근에 많아 사용되고 있다. 품질의 시대적 흐름(제조중심 -> 서비스 중심)의 변화는 나타내고 있지만, 품질 범주 내에서는 큰 변화가 없다는 것을 알 수 있다.
표 3.4의 주요 특징은 다음과 같다.
첫째, 중요한 단어가 비슷한 빈도로 사용되어 시대별 큰 차이가 없다(전 기간내에 많은 빈도로 나타나는 단어를 중요한 단어로 사용하였다).
둘째, 초창기 SQC 단어들 [ reliability, industry, method, response, sampling]이 많이 사용되었고, 1990년 이후 서비스 관련 단어 [ management, performance, customer, satisfaction]가 많이 사용되어, 시대적으로 중시되는 주제가 변화되고 있음을 나타나고 있다.
셋째, 2010년 이후 4차 산업혁명 단어들(AI, Big data, IoT, Robotics, Smart Factory 등) 사용이 미약하다. 2010년 이후 4차 산업혁명의 화제 속에서도 4차 산업혁명에 적용하는 논문은 없었다. 홍콩 품질학회에서 보내온 뉴스에는 4차 산업혁명관련 주요 토픽들(AI, Big data, IoT, Robotics, Smart Factory 등)이 연구 발표 및 강연회 등이 많으며, 최근 연구의 대부분을 이룬다. (https://qualityalchemist.blogspot.com)
표 3.3에서 600회 이상 사용된 [process, system, model, service] 4개 각 단어들의 각 Vol. 별로 사용빈도를 꺽은선 그래프로 살펴봤다. 각 Vol. 마다 논문 수가 달라서 각 비율(빈도수/논문 편수)로 나타냈다.
그림 3.4의 그래프에서는 최근에 Service 단어가 가장 많이 사용되고 있으며, process가 점점 낮아지는 추세를 나타내고 있다. 제조업 중심에서 서비스 중심으로 연구가 변화되고 있음을 나타내고 있다.
이상의 분석에서 한국 품질 학술 연구는 초기에 정착된 품질범주 안에서 크게 벗어나지 않았다는 현상은 한국 품질 연구의 태도가 보수적이라고 볼 수 있다(다른 학문 분야와 합치하려는 시도가 적었다). 4차 산업혁명은 모든 분야에 변화를 예고하고 있다. 현재는 한국 품질 발전의 방향에 대한 많은 연구가 필요한 중요한 때라고 본다.
4. 결 론
본 연구는 한국품질경영학회에서 발간하는 품질경영학회지의 초록만을 텍스트 마이닝 기법으로 연구동향을 살펴봤다. 본 연구를 통하여, 품질경영학회지 초록에 나타난 가장 많은 품질 단어는 무엇인지, 10년 단위로 품질경영학회지 초록에 나타나는 단어의 변화는 어떻한지를 알아보려 하였다.
연구의 주요결과는 다음과 같다.
첫째, 지난 40년간 연구 동향이 시대 변화에 따라 중요 단어가 변하고 있음을 알 수 있으나, 품질경영 전체 이론에서 보면 큰 변화가 없다. 100회 이상 사용된 22개 단어는 품질 범주에서 많이 사용되는 익숙한 단어들이다. [process, system, model, service] 단어는 600번 이상 사용 되었으며, [management, data, methods] 단어는 400번 이상 사용 되었다. 크게 보면 품질경영학회지 논문에 발표된 논문들은 품질 범주내에서 많은 연구가 이루어지고 있다는 것을 알 수 있다.
둘째는 초창기 SQC 단어들 [reliability, industry, method, response, sampling]이 많이 사용되었고, 1990년 이후 서비스 중시 단어 [management, performance, customer, satisfaction]가 많이 사용되어, 시대적으로 중시되는 내용을 나타나고 있다.
셋째는 2010년 이후 4차 산업혁명 단어들(AI, Big data, IoT, Robotics, Smart Factory 등) 사용이 미약하다. 다른 나라 품질학회에서는 4차 산업혁명관련 최근 관심분야의 연구가 많은 것과 대비된다.
이상의 분석에서 한국 품질 학술 연구는 품질범주 내에서 이루어져(새로운 학문 분야와 과감한 통합하려는 시도가 없었다는 의미) 보수적이라 할 수 있다. 4차 산업혁명의 시기로 모든 것이 변화될 것으로 예상된다. 한국 품질도 4차 산업혁명에 맞추어 새로운 품질 방향 등의 연구가 필요한 시점이다.
현재의 각 Vol. 별로 빈도수를 기본으로 연구 분야별(품질경영, SQC, 서비스, 품질 혁신 등)로 묶어서 시대별로 흐름을 연구하는 것과 외국 품질학회지(예, TQM & Business Excellence, 일본 품질관리지 등) 등과 비교하는 연구가 숙제로 남아 있다.