지난 몇 주 동안 두 가지 관련된 프로젝트에 매달렸습니다. 첫 번째는 2024년 Scientific Reports에 실린 Lee et al.의 논문, “Social signals predict contemporary art prices better than visual features, particularly in emerging markets"을 재현하는 작업이었습니다. 이 논문은 590명의 생존 작가로부터 나온 34,200건의 경매 기록으로 XGBoost 모델을 훈련합니다. 두 번째는 Art Evaluator라는 Django + Expo 플랫폼을 만드는 작업이었는데, 작가, 소장자, 경매 기록을 노드로 갖는 지식 그래프가 핵심입니다. 한마디로 위 같은 모델로 무언가 의미 있는 일을 하려고 할 때 필요한 데이터 인프라입니다.
두 프로젝트 모두 결국 같은 질문으로 돌아왔습니다. 미술품이 얼마에 팔릴지 정말로 예측할 수 있는가? 답은 가능하다, 입니다. 다만 작품 자체를 보면서는 안 됩니다. 의미 있는 변수는 거의 전부 사회적 신호입니다.
미술품 가치 평가가 어려운 이유#
코드를 짜기 전에 며칠을 들여서 감정인이나 경매소가 실제로 가격을 어떻게 매기는지 읽었습니다. 고려 요인 목록은 길고, 대부분은 깔끔하게 정량화되지 않습니다.
- 출처(provenance): 누가 소유해왔고, 어디에 전시됐고, 어떤 카탈로그에 실렸는가.
- 귀속과 진위: 작가의 재단으로부터 진품으로 확인된 작품은 단지 “전해지는(attributed to)” 작품보다 수십 배 가치가 있습니다.
- 작가의 명성: 개인전, 비엔날레 참가, 미술관 소장, 비평가의 평가.
- 상태: 보존 상태, 복원 이력, 보존 전문가의 보고서.
- 희소성: 에디션 크기, 형식, 작가의 작품 세계 내에서 주제가 얼마나 드문지.
- 매체: 캔버스에 유화가 종이 작업보다, 종이 작업이 판화보다 일반적으로 더 비쌉니다.
- 기관 인지도: MoMA, Tate, Louvre가 소장하고 있으면 2차 시장이 신뢰할 만한 도장을 받게 됩니다.
- 시장 타이밍: 최근 비교 사례가 중요합니다. 5년 전 비교 사례는 이미 낡았습니다.
소더비 전문가들은 “감정적 가치"라는 카테고리도 이야기합니다. 컬렉터의 욕구, 호가 경쟁의 역학, 개인적 공감 같은 것들입니다. 이런 요소가 합리적인 추정을 한참 넘어서까지 낙찰가를 밀어 올릴 수 있습니다. 직접 모델링할 수는 없지만, 경매소의 추정가를 통해 간접적으로 그 형태를 잡아낼 수 있습니다.
실무에서 가장 많이 쓰이는 평가 방법은 비교 매매 분석(comparable sales analysis) 입니다. 같은 작가의 비슷한 작품에 대한 최근 경매 결과를 찾아서 차이를 보정합니다. XGBoost 모델이 하는 일이 본질적으로 이것입니다. 다만 인간 감정인이 손으로 추적할 수 있는 것보다 훨씬 많은 특징을, 훨씬 큰 규모로 다룰 뿐입니다.
논문의 핵심 주장#
Lee et al.의 주장은 직관에 반합니다. 미술품의 시각적 내용은 가격을 거의 설명하지 못한다는 것입니다. 시각적 특징(색상, 구성, 엣지 밀도, ResNet18 임베딩)만 사용한 모델은 R² 약 0.055를 기록합니다. 평균을 찍는 것보다 약간 나을 뿐입니다.
작가 수준의 “사회적” 특징(경력 단계, 전시 이력, 과거 경매가, ArtFacts 순위)만 사용한 모델은 R² ≈ 0.73에 도달합니다. 여기에 경매소의 사전 추정가를 특징으로 추가하면 0.92까지 올라갑니다.
다시 말해 작품 자체는 거의 중요하지 않습니다. 누가 만들었고, 시장이 그 사람에 대해 이미 어떻게 말해왔는지가 중요합니다.
논문의 두 번째 주장은 이 격차가 신흥 시장에서 더 크다는 것입니다. 여기서 신흥 시장이란 미국, 영국, 프랑스, 독일이라는 기존 핵심 시장 외부를 뜻합니다. 그런 시장에서는 사회적 신호가 더 큰 역할을 하고, 동시에 전문가 추정가가 덜 정확해서, 알고리즘 예측이 가치를 더할 여지가 더 큽니다.
논문 재현하기#
받은 과제는 단순했습니다. 1인 개발 MVP로 논문을 재현할 것. 프로덕션 배포는 없고, 실시간 데이터 파이프라인도 없습니다. 충실한 재구현, 프로토타입 수준의 코드, 결과를 정리한 보고서.
데이터#
논문은 정제된 CSV를 보충 자료로 제공합니다.
| 파일 | 행 수 | 내용 |
|---|---|---|
Df_mloutfull.csv | 86,221 | 500개 이상의 컬럼을 가진 원본 데이터셋 |
df_for_ml_improved_up_to_2012.csv | 34,200 | 메인 정제 데이터셋, 1996–2012 |
df_for_ml_improved_old_market.csv | 29,853 | 기존 시장만 |
df_for_ml_improved_new_market.csv | 4,346 | 신흥 시장만 |
transactions.csv | 114,283 | 이미지 링크가 포함된 원본 경매 기록 |
전체 크기는 약 5GB입니다. RAM에 충분히 들어가고, 이 정도 크기의 데이터셋에 대한 XGBoost 훈련은 노트북 CPU에서 5분도 안 걸립니다. 핵심 모델에 GPU는 필요 없습니다. 이 정도 규모의 표 형식 데이터에 대해 그래디언트 부스티드 트리는 사실상 거의 공짜로 학습됩니다. 최근 몇 년을 신경망 쪽에서 보냈다면 잊기 쉬운 사실이죠.
특징#
모델은 38개의 특징을 세 범주로 나눠 사용합니다.
작가에 대한 정보 (30개):
- 인구통계: 나이, 성별, 학력, 명문대 출신 여부 플래그.
- 경력: ArtFacts 순위, 개인전, 그룹전, 비엔날레 참가, 수상 이력.
- 소장: 개인 및 공공 컬렉션 수.
- 가격 이력: 작가의 최근 5회/10회 판매에서의 평균, 중간값, 최고가, 최저가.
- 면적 보정 가격 이력 (제곱인치당 가격).
- 지리: 작가가 활동하고 거주하는 곳, 국가별 플래그로 인코딩.
- 매칭 플래그: 작품의 장르가 작가의 평소 장르와 일치하는가? 판매 국가가 일치하는가?
시장에 대한 정보 (8개):
- 경매소 등급 (1–4).
- 해당 연도, 해당 국가/지역의 가격 수준 (최소, 평균, 중간값, 최대).
작품 자체에 대한 정보 (시각 외):
- 가로, 세로, 제곱인치 면적.
- 매체 분류 (회화, 판화, 사진, 조각, 기타).
저 목록에서 빠진 것은 작품의 실제 시각적 내용에 대한 것이 하나도 없다는 점입니다. 그건 어블레이션 연구로만 들어옵니다.
학습/테스트 분할#
랜덤이 아니라 시간 기반입니다. 2011년 5월 이전 데이터는 학습용으로 (~80%, ~27,360 행), 그 이후는 테스트용으로 (~20%, ~6,840 행) 사용됩니다. 랜덤 분할을 하면 작가의 가격 이력 특징을 통해 미래 정보가 새어 나갑니다. 같은 작가의 기록을 학습/테스트에 무작위로 흩어놓으면, 테스트 셋의 행들은 롤링 윈도 특징을 통해 서로의 가격을 이미 “본” 셈이 되고, R²가 인위적으로 부풀려집니다.
한번 알고 나면 당연한데, 처음 만들 때는 놓치기 쉬운 것 중 하나입니다.
모델#
XGBoost 회귀로 log10(price_usd)를 예측합니다. 검증 슬라이스를 따로 떼어 max_depth와 learning_rate 하이퍼파라미터를 탐색합니다. 모델 변형은 두 가지입니다.
- 전문가 추정가 없이. 목표 R² ≈ 0.73.
- 전문가 추정가 포함. 목표 R² ≈ 0.92.
“추정가 포함” 변형은 경매소의 사전 추정가 하한과 상한을 추가 특징으로 사용합니다. 이 두 추정가만 단독으로 써도 R² ≈ 0.90이 나옵니다. 위에 사회적 특징을 얹으면 0.02 정도가 추가됩니다. 절대값으로는 작지만, 전문가가 이미 알고 있는 것을 넘어서 실제 예측 작업을 하는 부분입니다.
어디까지 맞추려고 했나#
논문을 능가하려는 게 아니었습니다. 모든 조건에서 그들의 R² 값을 ±0.03 이내로 맞추는 것이 목표였습니다. 헤드라인 수치(메타데이터만으로 ~0.73, 추정가 포함 ~0.92)는 재현성이 좋습니다. XGBoost는 시드를 고정하면 결정론적이고, 특징도 잘 정의되어 있습니다. 표류가 예상되는 부분은 두 곳이었습니다. 시각 특징 어블레이션은 PCA 차원이나 이미지 전처리의 작은 차이가 결과를 움직일 수 있고, 신흥 시장 분할은 4,346 행밖에 없어서 잡음이 큽니다.
시각적 특징이 거의 도움이 안 되는 이유#
저한테는 이게 가장 흥미로운 결과였습니다. 논문의 시각 파이프라인은 이미지 한 장당 8,971개의 숫자를 추출합니다.
- GIST 디스크립터 (960차원): 전반적인 공간 배치.
- 방향성 그래디언트 히스토그램(HOG) (2,915차원): 엣지 구조.
- 컬러 히스토그램 (4,096차원): 팔레트 분해.
- ResNet18 특징 (1,000차원): 사전 학습된 고수준 임베딩.
- 컬러풀니스 (1차원): 색의 선명도 스칼라.
- 복잡도 (1차원): 엣지 밀도 스칼라.
이걸 PCA로 압축해서 XGBoost에 넣으면 R² ≈ 0.055가 나옵니다. 색상만으로 0.056. 엣지 구조는 0.029. 신경망 임베딩은 0.009로 사실상 0입니다.
깔끔하게 설명하자면, 경매가는 개별 작품이 아니라 작가 수준에서 결정된다는 것입니다. 같은 작가의 두 그림은 캔버스에 무엇이 그려져 있든 비슷한 가격에 팔립니다. 가격이 매겨지는 건 서명이기 때문입니다.
경매 카탈로그 노트를 읽어본 적 있다면 이게 사실인 이유를 알 수 있을 겁니다. 그들은 거의 모든 단어를 출처, 전시 이력, 비교 매매에 씁니다. 작품 자체는 거의 묘사하지 않습니다.
저 5%라는 숫자를 진지하게 받아들이면, 작품의 미적 내용은 시장 가치와 거의 분리되어 있다는 뜻입니다. 시장이 보상하는 것이 무엇이든, 그건 캔버스 위에 있는 것이 아닙니다. 픽셀 수준에서 미술을 이해하는 모델은, 작가의 이력서만 아는 모델보다 가격 예측을 못할 겁니다.
Phase 3는 조건부였다#
논문의 이미지 링크 컬럼은 2012년에 유효했던 URL을 가리킵니다. 2026년에는 대부분이 죽었습니다. 제가 짠 계획은 8일 차에 이 위험을 짚어두었습니다. 100개의 URL을 무작위로 뽑아서 얼마나 살아있는지 보자. 절반 이상이 사라졌으면 시각 단계 전체를 건너뛰고 그 이유를 문서화한다.
어차피 시각적 특징은 가격 분산의 약 5%만 설명합니다. 그렇게 작은 숫자를 확인하기 위해 비트 부패와 2주씩 싸우는 건 좋은 거래가 아닙니다. 죽은 링크 발견을 보고서의 일부로 정리하고 넘어가는 게 낫습니다.
기존 시장 vs 신흥 시장#
논문은 기존 시장(미국, 영국, 프랑스, 독일)과 신흥 시장(나머지 19개국)에 대해 별도의 모델을 학습합니다. 핵심 결과:
| 특징 세트 | 기존 시장 R² | 신흥 시장 R² |
|---|---|---|
| 시각만 | 0.053 | 0.056 |
| 메타데이터 (사회적 신호) | 0.667 | 0.750 |
| 메타데이터 + 추정가 | 0.916 | 0.859 |
두 가지가 눈에 띕니다. 첫째, 사회적 신호는 신흥 시장에서 더 중요해집니다. 덜 중요해지지 않습니다. 기존 시장에 데이터가 더 풍부하니까 사회 특징의 성능도 더 좋을 거라고 짐작할 수 있는데, 정반대입니다. 신흥 시장에서는 사회적 신호가 예측 작업에서 더 많은 비중을 차지합니다.
둘째, 신흥 시장에서는 전문가 추정가가 덜 정확합니다. 추정가를 추가했을 때의 0.916 대 0.859 격차가 그것입니다. 기존 시장에서는 알고리즘 예측이 수십 년의 비교 데이터를 가진 소더비 전문가와 경쟁해야 합니다. 신흥 시장에서는 그 전문가의 데이터가 얇고, 알고리즘이 가치를 더할 공간이 더 큽니다.
이 모델을 상업적으로 배포하려고 한다면, 신흥 시장이 실제로 값어치를 하는 영역입니다.
명시할 가치가 있는 한계#
이건 논문 재현이지 프로덕션 시스템 구축이 아닙니다. 빠진 것들을 부분적으로 정리하자면:
- 실시간 데이터 파이프라인 없음. 모델은 1996–2012 경매 데이터로 학습하고 절대 갱신되지 않습니다.
- 배포 없음. 결과물은 노트북과 보고서이지 예측 API가 아닙니다.
- 드리프트 감지 없음. 한번 학습된 모델은 시장이 언제 바뀌었는지 모릅니다.
- 고정된 데이터셋. 크립토 아트, NFT, 코로나 이후 시장 변화는 학습 데이터에 존재하지 않습니다.
- 한국 시장 특화 없음. 케이옥션이나 서울옥션의 가격을 예측하고 싶다면 경매소별 특징과 어쩌면 한국 시장 전용 모델이 필요할 겁니다.
모델은 또한 과거의 패턴을 반영합니다. 현대 미술 시장이 2015년쯤에 구조적으로 바뀌었다면 (그렇게 주장하는 견해도 있습니다. 아트 페어가 1차 시장의 무대로 부상하고 새로운 컬렉터 인구가 진입했다는 주장입니다), 1996–2012의 패턴은 일반화되지 않을 수 있습니다.
논문에서 플랫폼으로#
논문을 읽으면서 두 번째 프로젝트에 대한 생각이 바뀌었습니다. Art Evaluator는 원래 미술 전시 펀딩을 위한 크라우드펀딩 마켓플레이스로 구상되었습니다. 작가는 다가오는 전시를 위한 자금을 미리 확보하고, 투자자는 경매 시장이 일반적으로 허용하는 것보다 더 일찍 신진 작가를 만나게 됩니다.
제품의 표면은 의도적으로 단순합니다. 작가가 자금이 필요한 다가오는 전시를 게시합니다 (장소, 일정, 출품 예정 작품). 투자자는 특정 전시를 단계별 금액($100, $500, $1,000, $5,000)으로 후원하고, 작품이 팔리면 업사이드의 일부를 가져갑니다. AI 에이전트가 작가-투자자 채팅의 대부분을 처리해서, 어느 쪽도 온라인 상태가 아니어도 대화의 흐름이 끊기지 않게 합니다. 한국 갤러리가 14시간 시차를 사이에 두고 미국 컬렉터와 이야기할 때 특히 유용합니다.
작가가 자산이고 작품이 자산이 아니라는 점이 와닿으면, 데이터 모델도 거기에 맞춰 바뀌어야 합니다. 중요한 것은:
- 각 작품을 누가 소유해왔는가 (그래프의 노드 체인).
- 어디에 전시됐는가 (기관 인지도 신호).
- 어떤 비교 작품들이 얼마에 팔렸는가 (작가의 경매 비교 사례).
- 이 작가의 다른 작품을 누가 또 소유하고 있는가 (컬렉터 네트워크 효과).
이것이 지식 그래프가 필요한 이유입니다. Django 백엔드(apps/artworks/models.py)는 네 가지 원시 타입을 모델링합니다.
Artist: 작품을 만드는 사람.AuctionRecord: 가격, 날짜, 경매소가 포함된 과거 판매 기록.OwnershipRecord: 누가 무엇을 언제부터 언제까지 소유했는가.ScrapeLog: 데이터 자체의 출처 정보. 모든 기록이 어디서 왔는지 감사할 수 있도록.
모바일 앱(Expo + React Native + @shopify/react-native-skia)은 이 모든 것을 force-directed 그래프로 렌더링합니다. useGraphData는 Django의 /api/graph/ 엔드포인트를 호출하고, useForceLayout은 매 틱마다 JS에서 d3-force 시뮬레이션을 돌리고, GraphCanvas는 결과를 Skia로 그립니다. 시간 범위 슬라이더로 연도를 스크럽하면서 네트워크가 진화하는 모습을 볼 수 있습니다. 어떤 컬렉터가 언제 진입했는지, 어떤 작가가 어느 미술관에 픽업됐는지, 2008년 침체기에 어떤 작품이 손을 바꿨는지가 보입니다.
각 노드 타입에는 고유한 모양과 색이 있습니다.
| 노드 타입 | 모양 | 색 |
|---|---|---|
| 작가 | 다이아몬드 | 빨강 |
| 작품 | 둥근 사각형 | 파랑 |
| 컬렉터 | 원 | 초록 |
| 딜러 | 원 | 주황 |
| 미술관 | 원 | 보라 |
| 유산 | 원 | 청록 |
| 경매소 | 육각형 | 회색 |
모양은 장식이 아닙니다. 수백 개의 노드를 보여주려고 줌아웃했을 때, 라벨이 렌더링되기를 기다리지 않고도 실루엣만으로 어떤 종류의 엔티티인지 알 수 있습니다. 원에 둘러싸인 다이아몬드는 컬렉터 네트워크를 가진 작가입니다. 여러 다이아몬드와 연결된 육각형은 다수의 작가를 다루는 경매소입니다. 한눈에 시장의 구조를 읽을 수 있습니다.
두 번째 탭은 같은 데이터를 vis-timeline 축에 보여줍니다. 소유 기간은 가로 막대로, 판매는 점 이벤트로. 같은 그래프의 다른 렌즈입니다. 특정 시점의 네트워크 모양이 아니라, 누가 무엇을 언제 가졌는지의 순서를 보고 싶을 때 유용합니다.
Art Evaluator 자체가 가격 예측 도구는 아닙니다. 그 아래 깔리는 데이터 레이어입니다. 동결된 2012 CSV 대신 살아있는 실시간 데이터로 Lee et al. 같은 모델을 먹이고 싶다면, 이게 바로 필요한 구조입니다.
가치 평가를 게임으로 만들기 (크라우드소싱)#
아직 만들지 않았지만 가장 관심이 가는 부분은 미술품 가치 평가를 게임으로 바꾸는 것입니다.
Lee et al. 논문은 경매소의 사전 추정가를 하나의 특징으로 사용해서 R²를 크게 끌어올립니다. 그 추정가가 가치 있는 이유는 그것이 훈련된 전문가들의 종합된 판단이기 때문입니다. 수천 건의 비교 작품을 봐왔고, 결과에 책임을 지는 사람들이죠. 하지만 경매소 전문가는 좁고 비싼 자원입니다. 전 세계에 몇백 명 정도이고, 특정 위탁품에만 작업하며, 아직 아무도 위탁하지 않은 작가들의 롱테일에는 손이 닿지 않습니다.
제가 계속 돌아오게 되는 질문은 이것입니다. 훨씬 더 넓고 저렴한 판단 풀에서 비슷한 신호를 합성할 수 있을까?
대략적인 디자인:
- 사용자에게 작품을 보여줍니다. 이미지, 크기, 연도, 작가 이름, 짧은 이력.
- 경매에서 얼마에 팔릴지 묻습니다.
- 가격 구간을 고르거나 낙찰가를 직접 추측하게 합니다.
- 답을 제출한 뒤 실제 판매가를 공개합니다.
- 시간이 지나면서 Brier 점수 스타일의 정확도 점수를 매깁니다.
- 리더보드, 일일 연속 출석, 연속 적중 배지를 노출합니다.
- 각 사용자의 미래 예측을 과거 정확도로 가중합니다.
미술품 가격에 대한 예측 시장을, 추측 게임의 형태로 만든 것입니다. 루프는 Geoguessr나 chess.com 퍼즐 레이팅과 같습니다. 반복 가능하고, 점수를 매길 수 있고, 피드백이 있어서 실력을 쌓을 수 있습니다. 잘 맞히는 사람은 리더보드에서 올라가고, 그들의 미래 추측은 종합 신호에서 더 큰 비중을 가집니다.
모델 쪽에서 진짜 쓸모가 생깁니다. 가중 평균된 추측들이 사회적 신호와 함께 XGBoost에 넣을 수 있는 특징이 됩니다. 군중의 정확도-가중 중간값이 낙찰가와 잘 상관된다면, 아직 진짜 추정가가 없는 작품에 대해 합성 경매소 추정가에 가까운 것을 갖게 됩니다. 정확히 Lee et al. 모델이 가장 도움이 필요한 작가 롱테일의 격차입니다.
콜드 스타트 측면도 있습니다. 모델은 풍부한 가격 이력을 가진 작가에 대해서는 잘 학습됐고, 판매가 세 건뿐인 작가에 대해서는 잘 못합니다. 판매 세 건과 군중의 추측 천 개라면 적어도 작업할 무언가가 됩니다. 크라우드소싱 가치 평가는 기저 데이터가 다루지 못하는 사례에 대한 학습 신호를 만들어내는 방법입니다.
여기서 게임화가 중요한 이유는, 군중을 신뢰할 수 있게 만드는 유일한 방법이 참여를 충분히 재미있게 만들어서 사람들이 자주 참여하게 하는 것이기 때문입니다. 단발성 폼은 한 번 클릭해서 넘긴 사람들의 잡음 데이터만 줍니다. 일일 연속 출석에 리더보드, 보정 배지가 있으면 같은 사람이 1년에 걸쳐 신중하게 고민한 500개의 예측을 만들어냅니다. 볼륨에 자기 선택(잘 맞히는 사람은 남고, 못 맞히는 사람은 지루해합니다)이 더해져야 잡음이 아닌 신호가 나옵니다.
만들기 전에 풀어야 할 설계 문제 몇 가지:
- 사용자에게 무엇을 보여줄 것인가? 이미지와 이력만? 아니면 맥락을 위해 비교 판매도 보여줄까? 맥락이 많을수록 더 잘 정보를 얻은 추측이 가능하지만, 그 말은 사용자가 이미 보여준 것을 그대로 되풀이한다는 뜻이기도 합니다.
- 가격 피드백을 얼마나 줄 것인가? 정확한 낙찰가? 범위? ±20% 이내였는지만? 너무 세밀하면 사용자가 특정 숫자에 앵커링되도록 훈련시키게 되고, 너무 모호하면 보정이 안 됩니다.
- 리더보드가 게임당하는 것을 어떻게 막을까? 플레이어들은 자기가 이미 아는 작가로 끌릴 겁니다. Banksy 추측은 실력이 아니라 거의 잡학입니다. 아마 Duolingo의 레슨 선택처럼 강제 무작위 샘플링을 도입하고, 작가 이름이 가려진 “블라인드” 라운드용 별도 랭킹이 필요할 겁니다.
- 사후확신 편향을 어떻게 다룰까? 사용자가 Basquiat 작품이 1억 1천만 달러에 팔렸다는 걸 알게 되면, 그걸 모르는 상태로 돌아갈 수 없습니다. 새롭게 보지 못한 작품의 공급이 루프를 정직하게 유지하는 핵심이고, 그 공급은 주당 한정되어 있습니다.
게임화 프레이밍은 플랫폼의 두 면을 함께 묶기도 합니다. 크라우드펀딩 쪽은 전시가 재무적으로 잘 됐을 때 투자자에게 보상합니다. 추측 게임 쪽은 돈을 낸 투자자든 아니든 가격을 잘 부르는 누구에게나 보상합니다. 둘 다 같은 아이디어의 변형입니다. 군중의 집단적 판단을 거래 가능한 신호로 바꾸자는 것이죠. 한쪽은 자본을 거래하고, 다른 쪽은 주의를 거래합니다. 진짜 우위를 길러낸 플레이어는 결국 투자자 쪽으로 졸업해서, 검증 가능한 가격 예측 정확도 트랙 레코드를 가지고 들어올 수 있습니다. “잘 아는 갤러리스트가 있다"보다 훨씬 좋은 필터입니다.
가져간 것들#
들어가기 전에 예상하지 못했던 몇 가지:
1. 사전 추정가는 매우 좋다. 경매소는 불투명한 가격 책정으로 비판을 많이 받지만, 그들의 사전 추정가만으로도 가격 분산의 약 90%가 잡힙니다. 전문가들이 무엇을 하든, 잘 하고 있습니다.
2. 작품 자체는 통계적으로 거의 의미가 없다. 미적인 이유로 미술을 좋아한다면 불편한 결론입니다. 시장은 당신이 보는 것에 가격을 매기지 않습니다. 다른 사람들이 인접한 작품에 이미 지불한 것에 가격을 매깁니다.
3. 시간 기반 분할은 가격 모델을 평가하는 유일한 정직한 방법이다. 랜덤 분할은 실제 프로덕션 배포에서 살아남지 못하는 보기 좋은 R² 값을 줍니다.
4. 그래디언트 부스티드 트리는 여기서 여전히 옳은 도구다. 논문에서 XGBoost는 모든 신경망 베이스라인을 이깁니다. 이 정도 규모의 표 형식 데이터, 이만큼의 엔지니어링된 특징 구조라면 트랜스포머에 손을 뻗을 이유가 없습니다.
5. 흥미로운 기회는 신흥 시장에 있다. 그곳이 전문가 가격 책정이 가장 얇고 알고리즘 예측이 채울 격차가 가장 큰 곳입니다.
6. 군중은 충분히 활용되지 않은 데이터 소스다. Lee et al. 모델에서 가장 큰 단일 특징은 경매소의 사전 추정가였습니다. 보정된 군중이 작가의 롱테일에 대해 비슷한 신호를 만들어낼 수 있다면, 그건 진짜 기회입니다. 모델 입력으로도, 그 자체로 제품 표면으로도.
두 프로젝트는 의도하지 않았던 방식으로 보완적이 됐습니다. 논문 재현은 무엇이 가격을 예측하는지를 가르쳐주었고, 플랫폼 작업은 그 지식을 실제로 사용하려면 어떤 데이터 구조가 필요한지를 가르쳐주었습니다. 게임화 아이디어가 둘을 함께 묶습니다. 플랫폼의 지식 그래프는 작품과 과거 판매를 공급합니다. 추측 게임은 군중에서 도출된 추정가 특징을 만들어냅니다. 모델은 그 특징을 사회적 신호와 함께 소비해서 그렇지 않으면 보이지 않았을 작가들에 대한 예측을 만들어냅니다.
아무것도 완성되지 않았습니다. 논문 재현은 보고서가 딸린 작동하는 프로토타입입니다. 플랫폼은 시드 데이터가 들어간 데모입니다. 크라우드소싱 평가 게임은 방금 읽으신 설계 노트로만 존재합니다. 다만 관통하는 줄기가 충분히 일관되어 있어서, 적절한 모양은 어느 정도 분명해 보입니다. 작품이 아니라 작가에 가격을 매기고, 전문가에만 의존하지 말고 군중을 종합하고, 가치 평가를 전문가들이 하향식으로 내려주는 것이 아니라 시장이 함께 만들어내는 것으로 다루는 것입니다.
시간이 주어진다면 다음에 만들 버전이 이것입니다.

