Ý nghĩa ký hiệu ; trong xác suất

probability
natural-language-process

#1

Mình đang đọc slide về NLP ở đây: NLP Stanford - bài 1 thì gặp một vài thắc mắc với ký hiệu về xác suất. Ví dụ như:

  1. Slide số 22 có viết P(w_{t + j} | w_t ; \theta) cái này có phải tìm xác suất có điều kiện của w_{t+j} khi đã biết giá trị của w_t\theta không?
  • Nếu đúng, tức là P(w_{t + j} | w_t ; \theta) = P(w_{t + j} | w_t , \theta) , vậy tại sao họ lại không ghi P(w_{t + j} | w_t , \theta)? Có phải họ đang muốn nhấn mạnh rằng chúng ta đang muốn esitmate tham số \theta nên mới sử dụng dấu ; thay cho dấu ,
  • Nếu sai, mình chưa có câu trả lời cho việc này… :smiley:
  1. Gần giống câu hỏi số 1, ở slide trang 24, có ghi P(problems | into ; u_{problems} , v_{into}, \theta) vậy xin hỏi P(problems | into ; u_{problems} , v_{into}, \theta) = P(problems | into , u_{problems} , v_{into}, \theta) hay P(problems | into ; u_{problems} , v_{into}, \theta) = P(problems , u_{problems} , v_{into}, \theta | into)?

Cám ơn các bạn đã đọc bài. Rất mong nhận được sự giúp đỡ từ các bạn.


#2

\theta ở đây là 1 biểu diễn word phải tìm để minimize hàm objective function. Với mỗi \theta thì objective function chỉ tính toán phụ thuộc P(w_{t + j} | w_t ) nên người ta để dấu “;” cho đỡ bị hiểu lầm là P(a|b,c) thì b và c được coi như vai trò tương đương nhau, còn \thetaw_t không hề tương đương. Dù thế nào đi nữa, ở đây chúng ta chỉ quan tâm xác suất của 2 từ đi kèm với nhau đó là P(w_{t + j} | w_t )


#3

Em đã rõ ạ. Em cám ơn anh.