경쟁 제품 간 비교 분석을 위한 토픽 모델링 기반 품질기능전개 프레임워크

Topic Modeling-based QFD Framework for Comparative Analysis between Competitive Products

Article information

J Korean Soc Qual Manag. 2023;51(4):701-713
Publication date (electronic) : 2023 December 31
doi : https://doi.org/10.7469/JKSQM.2023.51.4.701
*Master Student, School of Business, Dongguk University
**Professor, School of Business, Dongguk University
최승혁*, 정욱**,
*동국대학교 경영학부 석사과정
**동국대학교 경영학부 교수
Corresponding Author(ukjung@dongguk.edu)
Received 2023 November 28; Revised 2023 December 4; Accepted 2023 December 5.

Trans Abstract

Purpose

The primary purpose of this study is to integrate text mining and Quality Function Deployment (QFD) to automatically extract valuable information from customer reviews, thereby establishing a QFD framework to confirm genuine customer needs for New Product Development (NPD).

Methods

Our approach combines text mining and QFD through topic modeling and sentiment analysis on a large data set of 56,873 customer reviews from Zappos.com, spanning five running shoe brands. This process objectively identifies customer requirements, establishes priorities, and assesses competitive strengths.

Results

Through the analysis of customer reviews, the study successfully extracts customer requirements and translates customer experience insights and emotions into quantifiable indicators of competitiveness.

Conclusion

The findings obtained from this research offer essential design guidance for new product development endeavors. Importantly, the significance of these results extends beyond the running shoe industry, presenting broad and promising applications across diverse sectors.

1. 서 론

시장 경쟁이 심화되고 제품 수명 주기가 지속적으로 단축되는 기업 환경에서 기업은 변화하는 고객 요구를 신속하게 이해하고 이에 대응해야 한다. 고객의 요구를 충족시키는 시의 적절한 신제품을 시장에 소개하는 포괄적인 과정을 흔히 신제품 개발(new product development; NPD)이라고 한다(Kahn, 2013). NPD는 고객의 요구와 욕구, 경쟁 상황, 시장 내재적 특성 등 다양한 측면을 종합적으로 이해해야 한다. Yousefie et al.(2011)이 설명한 바와 같이 NPD 프로세스는 고객 요구사항(customer requirement; CR) 파악으로 시작하여 경쟁력 평가(competitiveness evaluation: CE)를 통해 확장되며, 제품의 전체 구조와 세부 기능이 엄격하게 검증되어 제품이 성공적으로 완성될 때까지 지속된다. 따라서 고객의 요구에 대응하기 위해서는 합리적이고 정확한 제품 설계를 구현하는 것이 필요하다(Wangand Chin, 2011).

품질기능전개(quality function deployment: QFD)는 제품 개발을 위한 고객 중심의 접근 방식이다. 이 방법은 가장 중요한 고객 요구사항을 식별하는 단계로 시작하며, 이러한 요구사항은 품질의 집(house of quality: HOQ)와 같은 구조화된 방법을 통해 제품 설계로 이어진다(Jayaswal et al., 2007). 또한, QFD는 비즈니스 의사 결정에 대한 경쟁 환경의 영향을 인식하면서 제품 설계를 생산 프로세스와 결합하는 것을 매우 강조한다(Yazdani et al., 2019). 따라서 생산 담당자에게 제품 개발 및 설계에 적합한 보다 과학적인 의사 결정 방법을 제안할 수도 있다. 전통적인 QFD는 일반적으로 CR 및 CE와 관련된 필요한 정보를 추출하기 위해 인터뷰 및 설문조사에 의존한다(He et al., 2019a; He et al., 2019b). 이러한 전통적인 접근 방식은 상당한 자원과 시간을 필요로 하며 응답한 고객의 수가 제한적일 수도 있다. 특히, 오늘날 정보통신 환경의 급속한 변화를 고려할 때 설문 조사를 통해 수집된 데이터는 시대에 뒤떨어진 진부한 데이터가 될 수도 있다(Culotta and Cutler, 2016). 최근 몇 년 동안 온라인 리뷰는 제품 및 서비스에 대한 소비자 선호도에 영향을 미치는 가장 중요하고 신뢰할 수 있는 정보원이 되었으며(Ahaniet al., 2019), 기업의 품질 관리 및 제품 개선에 도움이 되고있다(Singh et al., 2020). NPD의 초기 단계에서 설문 조사, 인터뷰 및 기타 전통적인 방법을 통하는 것 보다 온라인 고객 피드백의 직접적인 활용을 통해 취득한 고객 요구사항은 고객의 실제 요구를 보다 정확하게 반영할 수 있다.

따라서 본 연구에서는 텍스트 마이닝과 QFD를 결합하여 CR을 자동으로 추출하고 그들의 우선 순위를 결정하며 CE를 수행하는 방법론을 제안한다. 이러한 접근 방식은 NPD 단계에 효과적인 고객 중심 설계 방법론을 제공하기 위한 목표를 가지고 있다. 기본 프로세스는 다음과 같다.

(1) 첫 번째 단계는 웹 사이트에서 온라인 제품 리뷰를 추출한다. 이러한 온라인 리뷰는 CR을 식별하기 위해 분류되며, 각 CR의 우선 순위는 리뷰의 키워드 빈도에 따라 결정된다. (2) 문장을 기반으로 CR 속성 사전의 키워드에 대한 감성분석을 수행하여 각 CR에 대한 다양한 브랜드의 고객 인식 점수를 얻고, 이를 통해 CE를 수행한다. (3) 그리고 자동으로 추출된 CR들, 그들의 우선 순위 및 CE를 각각 QFD 차트에 반영하여 고객 요구사항과 경쟁사와의 우위 분석을 시각화 한다.

본문의 구조는 다음과 같다. 2장에서는 해당 분야와 관련 된 선행연구들을 살펴보고, 3장에서는 제안한 방법론의 연구 설계와 데이터 수집 과정을 소개한다. 4장은 제안된 방법의 효과와 실현 가능성을 검증하기 위해 5개 브랜드의 런닝화를 대상으로 사례 연구를 진행한다. 마지막 5장에서는 연구 결과와 향후 방향 및 한계점을 제시한다.

2. 선행연구

2.1 NPD에서의 QFD

QFD는 구조화된 제품 개발 프로세스를 지원하기 위해 일본에서 최초로 개발되었으며, 특히 자동차 및 대형 선박과 같은 복잡한 제품의 개발에 많이 사용되었다(Griffin, 1993). 시간이 지남에 따라 QFD는 제품 개발에서 널리 사용되었는데 그 이유는 아래와 같다.

첫째, QFD의 구현을 통해 기업은 NPD 프로세스를 체계화하고 제품 출시 리드 타임을 크게 단축하며 엔지니어링 수정 및 운영 비용을 최소화하여 전반적인 경쟁력을 높일 수 있다(Sullivan, 1986). 둘째, QFD는 정보 저장소의 역할을 수행하여 제품개발의 세부사항을 체계적으로 기록하고 기능 부서 간의 소통과 협업을 촉진한다(Hauser and Clausing, 1998). 셋째, QFD 프레임워크 내에서 고객 중심의 원칙은 전략적 초점으로 간주되며, 고객의 요구를 충족시키기 위해 자원을 할당할 수 있다(Griffin and Hauser, 1992). 마지막으로 QFD는 엔지니어링 설계 및 전략 계획의 원활한 통합을 효과적으로 관리 할 수 있다(Hauser, 1993).

Armacost et al.(1994)은 계층적 분석법(AHP)과 QFD를 결합하여 산업화된 주택 배경에서 고객 수요의 우선 순위를 정해주는 프레임워크를 설정했다. Tu et al.(2011)은 스포츠 헤드셋 개발에 QFD와 함께 AHP를 활용하여 제품 개발에 있어 구조화된접근법의 중요성을 강조하였다. Bayraktaroğlu et al.(2008)은 Kano 모델, AHP 및 QFD를 결합하여 도서관 서비스에 대한 고객의 요구를 분석하는 혁신적인 방법을 도입했다. 이러한 다각적인 접근법은 서비스 품질을 향상시키고 도서관 관리자들이 예산 배분, 서비스 배치, 마케팅 전략 수립에 도움을 주도록 설계되었다. 이 이외에도 QFD는 퍼지 AHP(Büyüközkan et al., 2007), 퍼지 다기준 의사결정(Liu, 2011) 등의 다른 기법들과 혼용되어 다양한 응용방법들이 제시되어 왔다. QFD는 NPD 문제를 해결하는 데 여전히 유용한 방법이지만 CR 및 CE와 관련된 신뢰성이 있고 효과적인 데이터를 획득하는 데 한계가 있다. 즉, 기존의 QFD는 주로 설문조사 등 방법에 의존하며 포괄적이고 정확한 데이터 소스를 확보하는 데 어려움이 있다.

2.2 QFD에서의 텍스트 마이닝과 토픽 모델링

전통적인 QFD 과정에 내재된 분석자의 주관성을 완화하기 위한 하나의 접근법은 텍스트 마이닝을 이용하여 고객의 목소리(VOC)를 수집하는 것이다. 텍스트 마이닝, 또는 텍스트 분석이라고도 불리는 이 방법은 비정형 텍스트 데이터로부터 가치 있는 고품질 정보를 추출하는 체계적인 프로세스를 의미한다. 온라인 리뷰 분석의 맥락에서 텍스트 마이닝은 주로 제품 특징 및 사용자의 감성을 추출하고 분석하는 데 중점을 두고 있다. 이를 위해 단어 빈도 분석 및 토픽 모델링과 같은 기술을 활용하여 텍스트 데이터에서 의미 있는 정보를 처리하고 추출한다.

QFD에서 텍스트 마이닝을 활용한 연구는 다양하게 이루어졌다. Zhao et al.(2005)은 사용 가능한 지식을 신속하게 식별하기 위해 설계된 텍스트 마이닝 기반의 시각화 프레임워크를 도입했다. 그들은 HoQ에서 영감을 얻어 사용자가 CR과 제품 사양의 해당 값에 집중할 수 있도록 설계된 기회 맵(Opportunity Map)을 설계했었다. Ni et al. (2007)은 확장된 QFD 접근법과 텍스트 마이닝 기술을 기반으로 공급자 선택 방법론을 개발했다. 최적의 공급자 조합을 결정하기 위해 혁신적인 상관관계 규칙 마이닝 알고리즘을 사용하여 고객 범주, 제품 사용 패턴 및 빈번한 고장 모드와 관련된 품질 요구사항을 파악했다. 또한 자동차 제조 산업의 사례 연구를 통해 그들의 연구 결과를 뒷받침했다. Park and Lee(2011)는 웹사이트에서 고객 의견을 추출하고 제품 규격 데이터로 변환하기 위한 프레임워크를 제안했다. 이 접근 방식은 온라인 리뷰에서 고객 의견을 수집한 다음 텍스트 마이닝 기술을 적용하여 실행 가능한 고객 요구 사항으로 변환하는 것을 포함한다. Asadabadi et al.(2023)은 QFD와 함께 텍스트 마이닝 기술을 활용하여 QFD모델 구현에 필요한 정보 추출 과정을 자동화하였다. 그러나 이러한 연구들은 고객의 요구사항을 단순히 텍스트 문서 내에 존재하는 키워드의 빈도 분석을 위주로 진행되어 텍스트 내에 잠재되어 있는 고객 불만 또는 실제 고객 요구를 추출하는데 한계가 있다.

고객의 요구사항을 보다 명확하게 이해하기 위해 최근 많은 연구에서 잠재 디리클레 할당(LDA) 토픽 모델링을 사용하여 고객 리뷰를 분류하고 있다. LDA는 텍스트 분석과 자연어 처리 분야에서 널리 사용되는 생성 확률 모델로, Blei et al.(2003)에 의해 제안되었다. 이 모델은 문서 집합 내에서 숨겨진 주제를 효과적으로 식별하는 방법을 제공해주며 다양한 응용 분야에서 토픽 모델링의중요한 도구로 부상하고 있다. Kang and Tucker(2016)는 WordNet、 PageRank 및 LDA를 활용하여 자연어처리(NLP) 기술을 통해 지도형 텍스트 마이닝 프로세스를 개발하였다. 이러한 제안된 프로세스를 통해 제품 리뷰에서 CR를 추출할 수 있다고 주장하였다. 또한, Zhan et al.(2008)은 온라인 리뷰의 기본 토픽 구조를 분석하기 위해 LDA를 활용하여 중요한 토픽을 식별하는 자동화된 합성 접근법을 제안하였다. Wang et al.(2018)은 LDA를 활용하여 두 경쟁 제품과 관련된 주요 토픽을 비교함으로써 CR에 대한 통찰력 있는 분석을 제공하는 연구를 진행하였다. 전반적으로 상기 연구들은 온라인 리뷰 텍스트 마이닝 분야에서 LDA 토픽 모델의 유용성을 활용하는데 초점을 맞추었으나 토픽으로 파악된 주제에 대한 고객들의 긍정적/부정적 감성의 정도를 파악하지는 못하였다.

2.3 QFD에서의 감성 분석

고객 리뷰를 주제별로 분류하는 것을 넘어 리뷰에 표현된 고객의 감성을 분석하여 고객의 요구사항과 기대에 대해 더 깊이 이해할 수도 있다. 오피니언 마이닝(opinion mining)이라고도 불리는 감성 분석(sentiment analysis)은 개인의 표현에 포함된 감성 극성을 식별하고 분류하는 방법으로, 이를 통해 사람들의 의견, 태도, 감성 표현을 평가할 수 있다(Medhat et al., 2014). 제품 리뷰에서의 감성 분석 기법의 초기 연구로서, Dave et al.(2003)은 단어 분류 및 감성 분류기를 결합하여 제품의 속성에 대한 고객의 관점을 불량, 혼합, 양호 세 그룹으로 분류하여 제품에 대한 고객의 전반적인 인식을 식별하였다. Berezina et al.(2016)은 TripAdvisor와 같은 플랫폼에서 호텔 리뷰의 텍스트 마이닝을 수행하면서 긍정적인 리뷰와 부정적인 리뷰를 구분하는 연구를 진행하였다. 그들의 연구 결과는 긍정적인 리뷰는 주로 직원의 태도와 같은 무형적인 측면으로 인해 호텔을 지지하는 반면, 부정적인 리뷰는 종종 가구와 같은 유형적인 측면에 대한 불만족에서 비롯된다는 것을 보여주었다. 이러한 통찰력은 제품에 대한 고객의 진정한 감성을 밝혀내어 제품의 개선과 품질의 향상에 노력해야 된다는 방향성을 제시해줄 수 있다. 한편, Zhang et al.(2012)은 부정적인 리뷰에서 다양한 제품 브랜드의 단점을 추출하기 위해 감성 사전 기반의 알고리즘을 도입하였으며, 이 연구는 제품 개선 전략을 모색하는 기업에 유용한 지침을 제공하였다. 특히 감성 분석은 CR의 기준을 선별하기 위해서도 사용될 수 있다. 감성 분석을 통해 CR의 긍정적인 또는 부정적인 극성을 평가함으로써 부정적 CR만을 추출할 수 있다. 그 다음 이러한 부정적인 CR을 분석하여 개선을 위한 제안 사항을 제공할 수 있다(Asadabadi et al., 2023).

그러나 기존 연구들은 주로 이미 정의된 CR의 감성 분석을 통한 우선순위에 초점을 맞추고 있으며, 아직까지 전체 고객 리뷰에서 CR을 정의하기 위해 잠재된 토픽을 추출하고 추출된 토픽에 대한 감성 점수를 파악하는 과정을 QFD 프레임워크 내에 반영하는 연구는 이루어지지 않았다. 또한 타사 제품 혹은 서비스와의 경쟁력 분석 측면에서 아직 고객 리뷰 데이터로부터 최종 인사이트를 자동으로 추출하는 단계에 도달하지 못하였으며, 경쟁력 평가는 여전히 전문가들의 주관적 판단을 기반으로 진행되고 있다. 따라서 본 연구는 토픽 모델링 및 감성 분석 등의 텍스트 마이닝을 활용하여 QFD의 CR과 CR의 우선순위를 파악하는 동시에, 신제품 개발 의사 결정에 유용한 기준값을 제공하기 위한 경쟁력 분석, 즉 CE의 전체적인 프레임워크를 제시하고자 한다.

3. 연구방법

3.1 연구 설계

본 연구 과정은 그림 1에 나와있는 것과 같이 4단계로 구성되었다. 제 1단계는 데이터 수집 및 전처리에 관한 것이다. 이 단계에서는 대상 제품과 관련된 고객 리뷰를 수집해야 한다. 온라인 고객 리뷰는 제품 리뷰 웹사이트와 소셜 미디어 플랫폼을 포함한 다양한 플랫폼에서 얻을 수 있다. 제 2단계에서는 토픽 모델링을 진행하다. 이 단계에서 는 문서를 토픽으로 군집하기 위해 LDA를 사용한다. 주요 목표는 고객 리뷰 내에서 제품 또는 서비스와 관련된 토픽을 도출하기 위해서이다. 제 3단계는 감성 분석을 진행하는 것으로 이 단계의 목적은 고객이 각 토픽에 대한 감성과 평가를 이해하고 분석하는 것이다. 본 연구에서는 다양한 브랜드의 고객경험을 비교하기 위해 초기 전처리된 데이터에 브랜드 별로 감성 분석을 따로 진행하였다. 그리고 제 4단계는 텍스트 마이닝 기반의 HOQ(text-mining-based HOQ; TM-HOQ) 완성 단계로서 주로 CR, CR의 우선 순위, 및 CE의 세가지 주요 구성 요소를 완성하는 것을 의미한다. LDA 토픽 모델링을 통해 생성된 토픽은 CRs로 전환하고 CRs의 우선 순위는 각 토픽별 고객 온라인 리뷰에서 추출한 연관성이 가장 높은 상위 25개 단어의 빈도를 기준으로 결정된다. 이어서 브랜드별 리뷰의 감성 분석 결과를 브랜드별 토픽(즉, CR)의 감성 분석으로 변환하여 CE를 얻어낸다. 이러한 평가는 각 브랜드의 장단점을 비교할 수 있는 직관적인 근거를 제공해 준다.

Figure 1.

Overall process of the proposed approach

3.2 데이터 수집

코로나19 확산세가 꺾이면서 세계 각국 마라톤 대회가 정상 운영을 재개하고 있다. 이러한 배경하에서 런닝화 시장은 다시 한 번 기회와 치열한 경쟁의 맞이하게 되었다는 것을 의미한다. 본 연구에서는 5개 브랜드의 런닝화 고객 리뷰를 수집하여 비교 분석을 진행하였다. 본 연구의 데이터는 Google Web Scraper를 활용하여 미국의 신발 및 의류 전문 온라인 소매업체인 ZAPPOS.com에서 5개 운동화 브랜드의 총 56,873개의 고객 리뷰를 수집하였다. 이 운동화 브랜드들은 Hoka One One, Brooks, Asics, New Balance와 On이다. Adidas, Nike 등과 같은 자사 공식 웹사이트가 아닌 Zappos 웹 사이트에서 일상적으로 자주 구매되는 운동화들을 대상으로 판매량이 가장 많은 브랜드 5개를 선택하였다. 고객 리뷰 데이터를 확보한 후, 중요한 사전처리 단계가 수행된다. 이 전처리 과정은 텍스트를 소문자로 변환하고 문장부호, 숫자, 불용어, 공백 등을 제거하는 몇 가지 필수 단계를 포함한다. 리뷰 수집 후 텍스트를 소문자로 변환하고 문장부호, 숫자, 불용어 및 공백을 제거하고 토큰화 및 정규화 등 일련의프로세스를 거쳐 텍스트 전처리를 진행하였다. 또한, 향후 감성 분석 단계를 위해 전처리된 고객 리뷰를 브랜드 카테고리에 따라 미리 분류해준다.

4. 사례분석 및 결과

4.1 LDA 토픽 모델링을 통한 CR 파악 및 우선 순위 식별

이 단계에서는 문서를 토픽으로 군집하기 위해 LDA를 사용한다. 주요 목표는 고객 리뷰 내에서 제품 또는 서비스와 관련된 잠재된 핵심 주제, 즉 토픽을 도출하기 위해서이다. LDA 토픽 모델링의 기본 개념은 각 문서가 여러 토픽으로 구성하며, 각 토픽은 단어의 확률 분포로 표현된다는 것이다(Vamshi et al., 2018). LDA 토픽 모델링의 주목할만한 장점 중 하나는 데이터 입력 시 주제에 대한 사전 지식이 필요 없다는 점이다. 토픽의 개수를 정할 때 참고할 수 있는 토픽 일관성(coherence)은 식별된 토픽의 품질을 평가하기 위한 중요한 기준으로 인식되고 있다(Pathan and Prakash, 2021). 본 연구에서는 최적의 LDA 모델을 얻기 위해 Python 도구 패키지인 ‘gensim’을 활용하여 4에서 10개의 토픽 수 범위에서 일관성 값을 계산하였다. 높은 일관성 값은 모델의 해석 정확도가 높고, 모형이 더 의미가 있음을 나타낸다.

최적의 LDA 모델링을 구축하기 위해 토픽 수 범위를 4부터 10까지 설정하여 일관성 점수를 계산하였다. 본 연구에서는 토픽의 수를 5개로 설정했을 때 가장 높은 점수를 얻었다. 이상적인 토픽 수를 확인 후에 LDA 토픽 모델링을 진행하였다. 토픽 이름 명명을 위해 상관성 매개변수(λ-value)를 0으로 설정하여 동일한 단어가 여러 토픽에 동시에 나타나 토픽 내용을 모호하게 하는 단어들을 제거하였다. 따라서 5개 토픽 별로 상위 25개 단어를 상관관계 기준으로 나열하고, 이들 단어가 모여 의미하는 바를 유추하여 토픽을 명명하였다. 5개 토픽에 대한 최종 명명은 다음과 같다: ‘Performance in Cushioning and Support’, ‘Pain Alleviation and Injury Management’, ‘Design Specifics and Quality Control’, ‘Sizing and Color Preferences’와 ‘Footwear Fit and Comfort’. 토픽 이름과 해당 단어들은 표 1에서 확인할 수 있다.

Top-25 most relevant word list for the topics

토픽 모델링 결과는 다양한 신발 관련 특성들을 분석하여, 각 토픽 별로 소비자의 선호도와 제품 특성을 반영한 키워드들을 제시하고 있다. ‘Performance in Cushioning and Support’ 토픽은 ‘support’, ‘cushion’, ‘walk’ 등의 키워드를 통해 신발의 지지력과 쿠션감이 사용자의 활동성과 편안함에 중요하다는 것을 강조하고 있다. ‘Pain Alleviation and Injury Management’ 토픽은 ‘pain’, ‘knee’, ‘plantar’ 같은 키워드로 신발이 통증 완화와 부상 예방에 어떻게 기여할 수 있는지가 중요하다는 것을 보여준다. ‘Design Specifics and Quality Control’ 토픽에서는 ‘lace’, ‘heel’, ‘sole’과 같은 키워드를 통해 신발의 디자인과 각 부분별 품질에 대한 소비자의 관심을 반영하고 있다. ‘Sizing and Color Preferences’ 토픽은 ‘size’, ‘color’, ‘style’ 키워드를 통해 사이즈와 색상이 사용자의 개인적인 취향과 스타일에 얼마나 중요한지를 강조한다. 마지막으로 ‘Footwear Fit and Comfort’ 토픽은 ‘wide’, ‘toe’, ‘narrow’ 등의 키워드로 신발의 착용감과 핏이 사용자의 편안함에 결정적인 영향을 미친다는 것을 보여주고 있다.

또한 토픽들의 중요성을 확인하기 위해 전체 리뷰에서 각 토픽에 포함된 상위 25개 단어에 대해 빈도 분석을 진행하였다. 표 1에 제시된 결과에 따르면 ‘Performance in Cushioning and Support’ 토픽이 리뷰에서 가장 높은 빈도를 차지하여 가장 높은 우선 순위인 1을 부여하였고, 이는 고객에게 가장 중요한 CR이라는 것을 의미한다. 반대로 ‘Design Specifics and Quality Control’ 토픽이 가장 낮은 우선 순위의 CR로 배정되었다.

4.2 감성 분석을 통한 CE 수행

감성 분석 단계의 목적은 고객이 온라인 리뷰 작성을 통해 특정 브랜드에 대해 나타낸 감성을 다시 각 CR별 감성 점수로 변환함으로서 각 CR에 대한 감성과 평가를 이해하는 것이다. 본 연구에서는 다양한 브랜드의 고객 경험을 비교하기 위해 초기 전처리된 리뷰 데이터에 대해 브랜드 별로 감성 분석을 따로 진행하였다. 따라서 고객 감성의 극성(긍정, 부정)을 확인하기 위해 Lexicon 감성 사전을 기반으로, 리뷰 문장 내 존재하는 단어들의 감성 점수를 이용하여 각 리뷰 문장의 감성 점수를 계산하였다. 그 계산 과정은 다음과 같다: (1) 토픽(즉, CR) 별로 연관성이 가장 높은 상위 25개 단어를 키워드로 선정하였다. (2) 각 고객 리뷰를 문장 별로 개별 문서로 재 분류하고, 이어서 문장 별 감성 점수를 계산하였다. 문장이 특정 키워드와 연관된 감성 점수를 얻으려면 해당 키워드가 문장 내에서 적어도 한 번 이상은 나타나야 한다. (3) 각 토픽에 대한 감성 점수는 해당 토픽 내의 키워드가 내포된 리뷰 문장에 대한 감성 점수의 합을 이용하여 해당 토픽의 총 감성 점수를 산출한다. 그리고 최종적으로는 추후 해당 토픽을 다루고 있는 문장의 빈도를 감안하여 감성 점수의 토픽별 평균 감성 점수를 이용한다.

예를 들어, 두 개의 고객 리뷰 문장들이 토픽 모델링을 통해 두 토픽으로 구성되어 있다고 가정해 보자. 즉, 'cute'를 키워드로 포함한 Topic 1과 'support'를 포함한 Topic 2로 식별되었다고 가정하자. 이제 토픽-문장 행렬을 구성하기 위해 특정 토픽의 키워드가 한 문장에 한 번 이상 나타나면 1로 표시하고, 그렇지 않으면 0으로 표시한다. 예를 들어 문장 1에 'cute'가 나타나면 해당 문장의 Topic 1 열에 1로 표기해준다. 다음으로, 각 문장에 대한 감성 점수를 계산한다. 문장 1이 런닝화에 대한 긍정적인 평가를 의미하는 감성 점수인 0.5 이고 반면 문장 2는 -0.2의 감성 점수로 부정적인 평가라고 가정하자. 토픽 별 감성 점수를 계산하기 위해, 각 문장의 감성 점수에 토픽-문장 행렬의 각 표기들을 곱해 준다. 예를 들어 문장 1에서 Topic 1과 Topic 2의 감성 점수는 각각 0.5 (즉, 0.5 × 1 = 0.5) 와 0 (즉, 0.5 × 0 = 0)이다. 마찬가지로 문장 2의 감성 점수도 동일한 방법으로 계산된다. 마지막으로, 특정 토픽이 언급된 여러 문장들의 감성 점수를 합산하여 해당 토픽의 총 감성 점수를 얻는다.

본 연구는 앞서 설명한 방법론에 따라 각 토픽 별 총 감성 점수를 산출하였다. 감성 점수가 높을수록 특정 측면에서 고객 만족도가 높다는 것을 의미한다. 그러나 브랜드 별로 리뷰 수가 다르고 키워드 빈도의 차이가 있기 때문에, 우선 해당 토픽을 다루고 있는 문자의 빈도수를 반영하여 평균 감성 점수를 산출하는 것이 중요하다. 그 후, 브랜드 간 비교를 용이하게 하기 위해 이들 평균 감성 점수를 min-max 스케일링 방법을 통해 정규화 하였다. 그 결과 같은 토픽 내에서 점수가 가장 낮은 브랜드는 0점, 가장 높은 브랜드는 1점, 그 외 브랜드는 0-1점 범위 내에 위치하고 있으며, 그 결과는 최종적으로 그림 2의 CE 열과 같이 표현된다.

Figure 2.

Final TM-HOQ Construction

4.3 TM-HOQ 프레임워크 구현

QFD 프로세스의 핵심은 HOQ이다(Yang et al., 2019). HOQ는 CR과 설계 요구사항(design requirements; DR)의 정량화 및 분석을 용이하게 하면서 동시에 두 속성 사이의 관계도 분석할 수 있다. 이 과정을 통해 CR을 DR로 체계적으로 변환하고 CE를 통합하여 전체 QFD 프로세스를 구축할 수 있다(Karsak, 2004). HOQ의 주요 구성 요소에는 CR, DR, CR-DR 간의 상호 관계를 설명하는 관계 행렬, DR간의 관계를 반영하는 상관 행렬, CR과 DR의 우선 순위 지정, 그리고 CE가 포함된다. HOQ의 구조도는 그림 2에 나와 있는 것과 같다.

본 연구에서 제안한 TM-HOQ 프레임워크는 주로 CR의 파악, CR의 우선 순위, 그리고 CE의 세가지 주요 구성 요소에 대해 텍스트 마이닝 기법을 적용한다. LDA 토픽 모델링을 통해 생성된 토픽은 CR로 전환하고 CR의 우선 순위는 각 토픽 별 고객 온라인 리뷰에서 추출한 연관성이 가장 높은 상위 25개 단어의 빈도를 기준으로 결정된다. 이어서 감성 분석 결과를 활용하여 CE를 얻어낸다. 이러한 평가는 각 브랜드의 장단점을 비교할 수 있는 직관적인 근거를 제공해준다. LDA 토픽 모델링에서 도출된 5개의 토픽은 CR로 지정되었으며, 이들의 우선 순위는 표 1에 표시되어 있다. 또한, 그림 2에 나와 있는 것처럼 감성 분석 결과를 CE로 반영되었다. 이러한 요소들(CR, CR의 우선순위, CE)을 통합하여 TM-HOQ 프레임워크를 구성하였으며, 그림 2에 나와 있는 것과 같이 이를 시각적으로 표현하였다.

그림 2에서 'On' 브랜드를 예로 CE를 살펴볼 때, 전체적으로 On의 리뷰가 다른 브랜드보다 높은 호평을 받고 있는 것을 확인할 수 있다. 특히, ‘CR1: Performance in Cushioning and Support’와 ‘CR2: Pain Alleviation and Injury Management’ 두 토픽에서 On의 런닝화는 경쟁력 지수가 1로 표기되어 경쟁 브랜드보다 우수한 평가를 받고 있다. 그러나 ‘CR3: Design Specifics and Quality Control’ 토픽에서는 On의 런닝화가 가장 낮은 등급인 0을 받아, 이 토픽에서 On의 경쟁력이 떨어진다는 것을 의미한다. 따라서 On은 제품의 품질을 개선하는데 노력을 기울이는 동시에 CR3 요구사항에서 경쟁력을 확보해야 할 것이다. 또한, 자원 할당 및 신제품 개발에 관련된 중요한 결정을 할 때 ‘CR4: Sizing and Color Preferences’ 와 ‘CR5: Footwear Fit and Comfort’ 간의 균형을 유지하는 것도 중요할 것이다.

5. 결론 및 토론

5.1 연구 요약

본 연구의 주요 목적은 품질 실무자 및 학자들이 텍스트 마이닝을 기존의 QFD의 장점과 결합하는 자동화된 방법을 제시하는 것이다. 이 방법론은 주관적인 전문가 판단에 대한 의존성을 완화하여 궁극적으로 NPD 과정의 객관성과 운영 효율성을 높이는데 있다. 보다 구체적으로 본 방법론은 (1) 웹 사이트에서 온라인 제품 리뷰 추출, (2) 토픽 모델링을 통해 CR을 식별, (3) 리뷰의 키워드 빈도에 따라 CR의 우선순위 결정, (4) 문장을 기반으로 CR 속성 사전의 키워드에 대한 감성분석을 수행, (5) 각 CR에 대한 다양한 브랜드의 고객 인식 점수 획득, (6) CR별 브랜드 간의 CE 수행 등으로 이루어져 있다. 기존의 QFD 모델은 인터뷰와 설문조사에 의존하는 경우가 많기 때문에 다수의 고객으로부터 정보를 수집하는 데 상당한 시간과 자원을 투자해야 했다. 본 연구에서 제안한 접근 방식인 텍스트 마이닝은 방대한 고객 기반의 리뷰를 신속하게 통합하고 텍스트 콘텐츠를 자율적으로 정리하고 분석하는 장점을 가지고 있음을 보이면서 고객의 요구사항과 상대적 우선순위에 대한 귀중한 정보를 제공하여 포괄적인 QFD 모델을 구축하는 기초를 형성하였다.

5.2 학문적 의의 및 실무적 시사점

본 연구는 QFD 및 NPD의 프로세스에서 어떻게 빅데이터 분석이 고객의 요구사항에 대한 정보 획득에 이용되는지를 보여주고 있다는 것에서 그 학술적 의미를 가지고 있다. 보다 구체적으로는, 첫째, 텍스트 마이닝의 다양한 기법들을 기존의 연구방법론과 혼용하여 사용하는 향후 연구 활동에 유용한 참고 자료가 될 수 있다. 둘째, 본 연구는 최근의 디지털 데이터를 활용한 고객경험 연구 동향과 맥을 같이 하며, 제조 산업의 품질관리 분야에서 온라인 고객 리뷰를 컴퓨터 과학, 특히 텍스트 분석 알고리즘과 원활하게 통합함으로써 시너지 효과를 발휘할 수 있음을 보여주고 있다. 이러한 학문 영역간 간 협력은 보다 의미있는 연구 결과를 생산할 수 있음을 강조하고 있다. 셋째, 본 연구에서 제시한 경쟁 제품 비교 분석을 위한 통합적 방법론의 예시를 보여줌으로써 평가 과정의 효율화뿐만 아니라 객관성을 강화하여 QFD 전문가들에게 고객 피드백을 분석하고 해석하는 체계적이고 효율적인 수단을 제공한다.

실무적으로도 본 연구는 다음과 같은 시사점을 제공한다. 최근 제조업에서 고객에 대한 이해도를 높이기 위하여 빅데이터 분석의 중요성과 그 수요에 대한 인식이 커지고 있다. 그럼에도 불구하고 이러한 빅데이터 분석의 활용은 기술적 장벽과 지식 부족으로 인해 실무자들로 하여금 그 효과의 잠재력을 충분히 현실화시키지 못하고 있다. 이러한 측면에서 본 연구에서 제시된 분석 방법은 제품 개발자들에게 고객의 잠재된 수요에 대한 통찰력을 얻을 수 있는 귀중한 도구를 제공한다. 이로 인해 제품 개발자는 고객 선호도를 더 깊이 이해할 수 있을 뿐만 아니라 NPD 프로세스의 비용과 시간을 절약하고 나아가서는 생산 효율성을 제고하고 제품 품질을 개선할 수 있다. 궁극적으로 이러한 텍스트 마이닝 분석 방법을 제품 개발 전략에 통합하면 기업은 고객 중심적 접근 방식을 통해 목표 고객의 실제 요구와 선호를 충족시킬 가능성이 더 높아진다고 할 수 있다. 이러한 실무적 활용을 위해서는 R과 Python 등과 같은 텍스트 마이닝을 위한 가장 강력한 프로그래밍 언어의 기본 사용법부터 시작하여 데이터 처리, 분석, 시각화까지의 전 과정을 포괄하는 교육이 필요하다. 교육의 초점은 기초 프로그래밍 기술부터 시작하여 데이터 수집 및 정제, 텍스트 처리 기법(예: 토큰화, 스테밍, 레마타이제이션), 주요 텍스트 분석 방법론(예: 감성 분석, 토픽 모델링), 그리고 결과 해석 및 시각화에 이르기까지 다양한 단계를 포함해야 한다. 또한, 이론적인 교육과 병행하여 실제 사례 연구와 프로젝트 기반 학습을 통해 실무적인 적용 능력을 키우는 것이 중요하다. 이외에도, 텍스트 마이닝을 위한 다양한 오픈 소스 소프트웨어와 클라우드 기반 도구들을 활용하는 방법에 대한 교육도 포함될 수 있다. 예를 들어, KNIME, RapidMiner와 같은 GUI 기반 도구는 프로그래밍 경험이 부족한 사용자들도 쉽게 데이터 분석을 수행할 수 있게 해준다. 마지막으로, 교육은 지속적인 학습과 업데이트가 가능하도록 온라인 리소스와 포럼, 워크샵의 참여를 장려하여 실무자들이 지속적으로 기술을 발전시킬 수 있도록 돕는 것이 중요하다.

5.3 연구 한계점 및 향후 연구 방향

그러나 본 연구는 다음과 같은 한계점을 갖고 있다. 첫째, 본 연구의 최종 HOQ 프레임워크는 불완전한 상태로 남아 있다. 일부 누락된 모듈로는 DR 간의 상관 행렬, DR의 우선 순위, 그리고 CR-DR 간의 상관 행렬이 있다. 현재 이 영역의 연구는 아직 전문가의 주관적 판단이나 지식, 경험에 의존하고 있는 것이 현실이다. 비록 일부 연구에서는 CR과 관련된 특허 기술을 활용하여 DR를 결정하는 경우도 있지만, 특허는 제품 설계 기술의 일부만을 포함하고 있으며, 공공 기술이나 설계 세부 사항은 특허 문서만으로는 전체 DR를 확정하기 어렵다. 본 연구에서 예를 든 고품질의 우수한 런닝화를 개발하기 위해서는 재료과학, 운동학, 디자인 미학, 공학 등 다양한 분야와 연관된 전문 지식이 요구된다. 특허 기술이나 인터넷에서 사용 가능한 제한된 정보만 의존해서는 체계적이고 전문적인 DR을 구축하는데 큰 어려움이 있다. 전반적인 HOQ 프레임워크의 완전한 자동화를 완성하기 위해서는 기업 내부의 DR 데이터베이스를 구축하고 활용하는 것이 이상적이고 효율적일 것이다. 둘째, QFD 프레임워크의 자동화를 달성하더라도 실제 제품이 생산되고 시장에 투입 될 때까지는 이 방법론의 효과성(effectiveness)을 검증하기 어렵다. 그 효과성을 평가하는 유일한 기준은 이러한 방법론을 활용한 제품이 고객의 피드백에 근거한 최종 평가와 비용-편익 분석이 뒤따라야 한다. 이는 고객에 대한 이해를 다루는 텍스트 마이닝을 이용한 대부분의 연구에서 한계점으로 지적되고 있지만, 여전히 중요한 지적사항이다. 하지만 본 연구는 위에서 언급한 한계점에도 불구하고 제조업 내 고객의 요구사항에 대한 이해를 위해 인터넷 상의 빅데이터를 활용한다는 중요한 의미를 가지고 있다. 본 연구가 실제 현장에서의 제품 및 서비스 개선 활동에 실질적인 지침을 제공하고 이 분야의 추가 연구를 위한 참고자료가 될 것을 기대한다.

References

Ahani A., Nilashi M., Yadegaridehkordi E., Sanzogni L., Tarik A. R., Knox K., Ibrahim O.. 2019;Revealing customers’ satisfaction and preferences through online review analysis: The case of Canary Islands hotels. Journal of Retailing and Consumer Services 51:331–343.
Armacost R. L., Componation P. J., Mullens M. A., Swart W. W.. 1994;An AHP framework for prioritizing customer requirements in QFD: an industrialized housing application. IIE transactions 26(4):72–79.
Asadabadi M. R., Saberi M., Sadghiani N. S., Zwikael O., Chang E.. 2023;Enhancing the analysis of online product reviews to support product improvement: integrating text mining with quality function deployment. Journal of Enterprise Information Management 36(1):275–302.
Bayraktaroğlu G., Özgen Ö. 2008;Integrating the Kano model, AHP and planning matrix: QFD application in library services. Library Management 29(4/5):327–351.
Berezina K., Bilgihan A., Cobanoglu C., Okumus F.. 2016;Understanding satisfied and dissatisfied hotel customers: text mining of online hotel reviews. Journal of Hospitality Marketing and Management 25(1):1–24.
Blei D. M., Ng A. Y., Jordan M. I.. 2003;Latent dirichlet distribution. J. Mach. Learn. Res 3:993–1022.
Büyüközkan G., Feyzioğlu O., Ruan D.. 2007;Fuzzy group decision-making to multiple preference formats in quality function deployment. Computers in Industry 58(5):392–402.
Culotta A., Cutler J.. 2016;Mining brand perceptions from twitter social networks. Marketing science 35(3):343–362.
Dave K., Lawrence S., Pennock D.M.. 2003;Mining the peanut gallery: opinion extraction and semantic classification of product reviews. Paper presented at the Proceedings of the 12th International Conference on World Wide Web
Griffin A., Hauser J. R.. 1992;Patterns of communication among marketing, engineering and manufacturing—A comparison between two new product teams. Management Science 38(3):360–373.
Griffin A., Hauser J. R.. 1993;The voice of the customer. Marketing Science 12(1):1–27.
Hauser J. R.. 1993;How Puritan-Bennett used the house of quality. MIT Sloan Management Review 34(3):61.
Hauser J. R., Clausing D.. 1998;The house of quality. Harvard Bus. Rev. 66(5/6):63–73.
He W., Tian X., Wang F. K.. 2019;Innovating the customer loyalty program with social media: A case study of best practices using analytics tools. Journal of Enterprise Information Management 32(5):807–823.
He W., Zhang W., Tian X., Tao R., Akula V.. 2019;Identifying customer knowledge on social media through data analytics. Journal of Enterprise Information Management 32(1):152–169.
Huang S., Zhang J., Yang C., Gu Q., Li M., Wang W.. 2022;The interval grey QFD method for new product development: Integrate with LDA topic model to analyze online reviews. Engineering Applications of Artificial Intelligence 114:105213.
Jayaswal B., Patton P., Zultner R.. 2007. The design for trustworthy software compilation understanding customer needs: Software QFD and the voice of the customer Prentice Hall Press.
Kang S. W., Tucker C. S.. 2016. Automated mapping of product features mined from online customer reviews to engineering product characteristics. In International design engineering technical conferences and computers and information in engineering conference (50084p. V01BT02A023) American Society of Mechanical Engineers.
Karsak E. E.. 2004;Fuzzy multiple objective programming framework to prioritize design requirements in quality function deployment. Computers and Industrial Engineering 47(2–3):149–163.
Liu H. T.. 2011;Product design and selection using fuzzy QFD and fuzzy MCDM approaches. Applied Mathematical Modelling 35(1):482–496.
Medhat W., Hassan A., Korashy H.. 2014;Sentiment analysis algorithms and applications: A survey. Ain Shams Engineering Journal 5(4):1093–1113.
Ni M., Xu X., Deng S.. 2007;Extended QFD and data-mining-based methods for supplier selection in mass customization. International Journal of Computer Integrated Manufacturing 20(2–3):280–291.
Park Y., Lee S.. 2011;How to design and utilize online customer center to support new product concept generation. Expert Systems with Applications 38(8):10638–10647.
Pathan A. F., Prakash C.. 2021;Unsupervised aspect extraction algorithm for opinion mining using topic modeling. Global Transitions Proceedings 2(2):492–499.
Singh A., Jenamani M., Thakkar J.. 2020;Do online consumer reviews help to evaluate the performance of automobile manufacturers? Journal of Enterprise Information Management 33(5):1153–1198.
Sullivan L.P. 1986. Quality function deployment. Quality Progress (ASQC) p. 39–50.
Tu N., Zhang T., He Q., Zhang H., Li Y.. 2011. Applying combined AHP-QFD method in new product development: A case study in developing new sports earphone. In MSIE 2011 p. 80–85. IEEE.
Vamshi K. B., Pandey A. K., Siva K. A.. 2018. Topic model based opinion mining and sentiment analysis. In 2018 International Conference on Computer Communication and Informatics (ICCCI) (1–4) IEEE.
Wang W., Feng Y., Dai W.. 2018;Topic analysis of online reviews for two competitive products using latent Dirichlet allocation. Electronic Commerce Research and Applications 29:142–156.
Wang Y. M., Chin K. S.. 2011;A linear goal programming approach to determining the relative importance weights of customer requirements in quality function deployment. Information Sciences 181(24):5523–5533.
Yang C., Cheng J., Wang X.. 2019;Hybrid quality function deployment method for innovative new product design based on the theory of inventive problem solving and Kansei evaluation. Advances in Mechanical Engineering 11(5):1687814019848939.
Yazdani M., Kahraman C., Zarate P., Onar S. C.. 2019;A fuzzy multi attribute decision framework with integration of QFD and grey relational analysis. Expert Systems with Applications 115:474–485.
Yousefie S., Mohammadi M., Monfared J. H.. 2011;Selection effective management tools on setting European Foundation for Quality Management (EFQM) model by a quality function deployment (QFD) approach. Expert Systems with Applications 38(8):9633–9647.
Zhan J., Loh H. T., Liu Y.. 2008. Summarizing online customer reviews automatically based on topical structure. In : In Web Information Systems and Technologies: Third International Conference, WEBIST 2007. Barcelona, Spain; March 3–6, 2007; Revised Selected Papers 3 (245–256). Springer Berlin Heidelberg.
Zhang W., Xu H., Wan W.. 2012;Weakness Finder: Find product weakness from Chinese reviews by using aspects based sentiment analysis. Expert Systems with Applications 39(11):10283–10291.
Zhao K., Liu B., Tirpak T. M., Xiao W.. 2005;Opportunity map: a visualization framework for fast identification of actionable knowledge. In Proceedings of the 14th ACM international conference on Information and knowledge management (60–67)

Article information Continued

Figure 1.

Overall process of the proposed approach

Figure 2.

Final TM-HOQ Construction

Table 1.

Top-25 most relevant word list for the topics

Topic Key words Title Frequency Priority
1 0.100*support, 0.087*walk, 0.046*light, 0.041*cushion, 0.039*mile, 0.037*arch, 0.021*runner, 0.020*supportive, 0.018*weight, 0.018*lightweight, 0.017*walking, 0.017*running, 0.013*provide, 0.011*everyday, 0.011*workout, 0.010*daily, 0.010*gym, 0.009*stability, 0.007*treadmill, 0.007*distance, 0.006*exercise, 0.006*road, 0.005*enjoy, 0.005*casual, 0.005*adrenaline Performance in Cushioning and Support 27,668 1
2 0.050*pain, 0.038*recommend, 0.036*hurt, 0.030*hour, 0.027*knee, 0.020*plantar, 0.017*fasciitis, 0.017*stand, 0.017*issue, 0.012*shift, 0.011*fresh foam, 0.010*nurse, 0.008*leg, 0.008*surgery, 0.007*trainer, 0.007*hip, 0.007*amazing, 0.006*period, 0.005*ache, 0.005*podiatrist, 0.005*spend, 0.005*job, 0.004*injury, 0.004*hospital, 0.004*joint Pain Alleviation and Injury Management 18,027 3
3 0.026*lace, 0.024*heel, 0.018*tongue, 0.018*sole, 0.015*model, 0.013*design, 0.013*quality, 0.012*top, 0.010*material, 0.010*slip, 0.009*sock, 0.009*previous, 0.008*bottom, 0.007*tie, 0.007*stiff, 0.006*upper, 0.005*thin, 0.005*fabric, 0.005*foam,,0.005*stick, 0.004*inside, 0.004*hole, 0.004*pad, 0.003*thick, 0.003*mesh Design Specifics and Quality Control 12,519 5
4 0.171*size, 0.087*color, 0.038*style, 0.037*true, 0.034*half, 0.034*small, 0.026*big, 0.020*black, 0.019*large, 0.016*cute, 0.016*white, 0.008*usual, 0.008*compliment, 0.007*wait, 0.007*marathon, 0.007*blue, 0.007*exchange, 0.006*choice, 0.005*fun, 0.005*bright, 0.004*fast, 0.004*street, 0.003*original, 0.003*purple, 0.003*gray, Sizing and Color Preferences 18,286 2
5 0.105*wide, 0.090*toe, 0.063*narrow, 0.060*box, 0.037*width, 0.022*tight, 0.011*snug, 0.010*wider, 0.010*extra, 0.010*stylish, 0.009*length, 0.008*roomy, 0.008*medium, 0.006*training, 0.004*glove, 0.004*accommodate, 0.003*space, 0.003*standard, 0.003*middle, 0.003*excite, 0.007*bunion, 0.003*midsole, 0.003*durability, 0.003*quick, 0.003*combo Footwear Fit and Comfort 14,722 4