Articles of google bigquery

Número de repositorys Github en un momento determinado en el pasado

¿Es posible search repositorys de Github de acuerdo con una palabra key en un momento determinado en el pasado usando githubarchive.com ? Github API tiene function de repositorys de búsqueda , que me gustaría utilizar para encontrar la list de repositorys, pero en un momento determinado del pasado. Ejemplo: Si busco la palabra key hippopotamus […]

Recuperando idiomas y observadores de estrellas de los repositorys de GitHub

Soy nuevo en SQL y GitHubArchieve e bash get la list de idiomas y observadores de estrellas de los repositorys populares en GitHub. La información que estoy buscando es repo id, repo idiomas (idiomas + porcentaje), repo stargazers (y sus husos horarios). Entonces, mi solución a esto fue recuperar los repositorys más populares y luego […]

¿Cómo contar events push en GitHub usando BigQuery?

Intento utilizar el set de datos públicos de GitHub en BigQuery para contar events – PushEvents, en este caso – por repository a lo largo del time. SELECT COUNT(*) FROM [githubarchive:github.timeline] WHERE type = 'PushEvent' AND repository_name = "account/repo" GROUP BY pushed_at ORDER BY pushed_at DESC Básicamente solo recupere el recuento de un repository y […]

¿Faltan datos en Github Archive en Big Query?

¿Faltan datos en Github Archive en Big Query? Usando las tablas de BigQuery del file Github y ejecutando una consulta sobre requestes de extracción para el repository typelevel / cats , no hay inputs anteriores al 1/1/2016, a pesar de que el repository real muestre actividad que comienza en 1/28/2015. Enlace al repo github que […]

GitHub BigQuery confirma la consulta a lo largo del time que no devuelve resultados para ciertos repos

Estoy tratando de extraer datos sobre las confirmaciones mensuales de GitHub a lo largo del time utilizando el set de datos público en Google BigQuery. La siguiente consulta proporcionó resultados para Chef y Ansible pero no devolvió nada para Puppet o Salt. SELECT MONTH(committer.date) month, YEAR(committer.date) year, repo_name, COUNT(*) commits, FROM [bigquery-public-data:github_repos.commits] WHERE repo_name IN […]

Cómo extraer los datos de la línea de time de github de BigQuery

Tengo problemas para acceder a la línea de time de GitHub desde BigQuery . Estaba usando la siguiente consulta: SELECT repository_name, actor_attributes_company, payload_ref_type, payload_action, type, created_at FROM githubarchive:github.timeline WHERE repository_organization = 'foo' and created_at > '2014-07-01' y todo estaba funcionando bien. Ahora parece que la tabla githubarchive: github.timeline ya no está disponible. He estado mirando […]

select url de repository de github_timeline: grupo presiona y descarga por repositorys, y filtra repositorys por stargazers

No sé sql, traté de documentarme pero no pude lograr el resultado que quiero. Estoy viendo esta consulta en Bigquery, en contra de Github_timeline: SELECT repository_url, actor_attributes_login FROM [githubarchive:github.timeline] WHERE type='WatchEvent' AND actor_attributes_login IN ( SELECT actor_attributes_login FROM [githubarchive:github.timeline] WHERE type='WatchEvent' GROUP BY actor_attributes_login HAVING (count(*) > 1) AND (count (*) < 500) ) GROUP […]

Obtener las últimas informaciones de repository de Github Archive

Quiero recuperar las últimas informaciones sobre un repository usando Google Big Query en el set de datos de la línea de time del file github. Intenté unirme a max (created_at) pero recibo información muy incompleta. Aquí está la consulta para el repository de Rails: SELECT * FROM [githubarchive:github.timeline] a JOIN EACH ( SELECT MAX(created_at) as […]

¿Cómo get el número total de estrellas de GitHub para un repository dado en BigQuery?

Mi objective es rastrear con el time la popularidad de mi repo de BigQuery. Quiero usar sets de datos BigQuery disponibles públicamente, como GitHub Archive o el set de datos GitHub El set de datos GitHub sample_repos no contiene una instantánea de los recuentos de estrellas: SELECT watch_count FROM [bigquery-public-data:github_repos.sample_repos] WHERE repo_name == 'angular/angular' devuelve […]

BigQuery: ¿Cuándo se actualiza GHTorrent y cómo get información actualizada?

Los ghtorrent-bq son geniales para tener una instantánea de GitHub, sin embargo, no está claro cuándo se actualiza y cómo podría get datos más actualizados.